
溫網時事新聞,盡管中國的DeepSeek在全球備受關注,但人們對DeepSeek的神秘創始人梁文鋒卻知之甚少。
在今天的BigTakeAsiaPodcast節目中,主持人K.OanhHa與彭博社的SarithaRai談論了帶領DeepSeek走向人工智能前沿的科技創始人,以及該公司的崛起如何揭示人工智能主導地位的爭奪戰。
以下是經過簡單編輯的談話記錄:
K.OanhHa:今年早些時候,中國人工智能初創公司DeepSeek的一款新產品震驚了世界,也震動了華爾街。
湯姆·麥肯齊:中國的DeepSeek正在震驚整個人工智能世界。隨著其應用飆升至下載量排行榜榜首,科技股卻暴跌。
哈:盡管受到全球關注,但人們對DeepSeek背后的男人——中國企業家梁文峰——卻知之甚少。
SarithaRai:梁文峰無疑是一個神秘人物。
Ha:彭博社的SarithaRai報道亞洲的人工智能。
雷:他絕對是我見過的最難以接近、最低調的科技企業家之一。為了說明他有多注重隱私,我們翻遍了他的網站等等,都沒能找到他的任何照片。但他最終出現在了與習近平主席的一次高調會晤中,那張照片被傳遍了全世界,他無處不在。
哈:那這位神秘男子長什么樣呢?
Rai:他身材苗條,戴著眼鏡,但話不多
哈:娃娃臉?
雷:是的,我想我們可以這樣形容他。
哈:DeepSeek很少回答關于梁的問題,理由是涉及隱私。但薩麗塔和她的同事們對這位顛覆科技界的AI系統之人充滿好奇。因此,他們采訪了數十位熟悉梁工作的人,從前雇員、研究員同事到投資者和業內人士。
雷:我們發現,他確實非常低調,非常害羞,但卻異常有動力、才華橫溢、充滿激情。我認為他在某種程度上把DeepSeek視為一項使命,旨在在人工智能領域建立中國,努力確保中國成為人工智能領域一支不可忽視的力量。
哈:歡迎收聽彭博新聞社的《亞洲大事記》。我是阿恩·哈。每周,我們都會帶您深入了解一些全球最大、最強大的經濟體,以及推動這個瞬息萬變的地區的市場、巨頭和企業。今天的節目:梁文峰是誰?我們將了解這位帶領DeepSeek走在人工智能前沿的神秘科技創始人。此外,該公司的迅速崛起又能為我們揭示中美人工智能競賽的哪些信息?
哈:薩麗莎,謝謝你加入我們。我對人工智能很著迷。你們的故事講得真有趣。我們可以先聊聊——梁文峰是誰?我們對他的出身了解多少?
賴:蘇亮大約40歲,出生在廣東省一個叫米里嶺的小村莊。他的父母是學校老師,主要教小學。他非常聰明,后來在浙江大學學習,并在那里獲得了碩士學位。
哈:在浙江大學,梁和他的朋友們沉浸在各種科技領域:機器學習、信號處理、電子工程。他們甚至在金融危機期間開發了股票交易程序。畢業后,梁與兩位同學聯手創立了一家名為High-FlyerManagement的量化對沖基金。
雷:所以量化基金基本上是利用數學模型和統計分析來進行股票交易。決策過程中不涉及人類。在巔峰時期,High-FlyerManagement管理著大約140億美元的資產,所以這是一支相當規模的基金。而且,在其最成功的運營時期,它為投資者提供的年化回報率平均達到35%。所以我認為它的表現確實非常出色。
Ha:據前員工透露,High-Flyer的創業文化充滿極客氣息。該公司早期的招聘啟事宣稱吸引了來自谷歌和Facebook的頂尖人才,并表示他們正在尋找擁有“奇特才華”的數學和編程“極客”。
Rai:早期的招聘啟事也提到了謝爾頓,他是美國著名情景喜劇《生活大爆炸》中的主角,非常尷尬。
謝爾頓·庫珀:例如,我哭是因為別人很愚蠢,這讓我很難過。
雷:謝爾頓有一大批粉絲,而且他幽默風趣,這并非刻意為之。所以,你知道,DeepSeek早期的整體文化就是圍繞著重現那種極客、書呆子文化。那里有免費零食、撲克游戲之夜。每個人都穿著T恤和拖鞋。
哈:聽起來是個很棒的工作場所
雷:是的,那確實是一種非傳統的創業文化。與你可能在中國的大型科技公司(例如阿里巴巴和騰訊)看到的文化不同。
哈:梁是如何從量化金融轉型到人工智能并創建DeepSeek的?
雷:梁一直對機器學習和人工智能有著濃厚的興趣。幾個月后,OpenAI推出了ChatGPT,這個聊天機器人一夜之間風靡全球。當時是2023年春天,ChatGPT發布幾個月后,梁宣布成立DeepSeek。DeepSeek在其早期宣言中談到了摒棄平庸,應對人工智能領域的重大挑戰,當然,最終的目標是攻克通用人工智能。
哈:宣言還闡述了DeekSeek的雄心——將中國定位為尖端技術的領導者。
雷:你知道,梁小軍接受了兩次采訪,雖然這兩次采訪并不常見。在這兩次采訪中,他都談到要讓中國的人工智能生態系統走向世界前沿。你知道,中國一直被指責為模仿者。他希望人工智能中國能夠走一條不同的道路。
Ha:DeepSeek進展很快。自2023年以來,它已經發布了超過六個AI模型,并幫助開創了一種名為“稀疏性”的技術,使這些模型能夠更高效地訓練和運行。開發人員開始注意到這一點。然后,在今年早些時候——
DavidGura:現在回到頭條新聞,DeepSeek正在震撼全球科技……
雷:他們發布推理模型R1時,引發了行業巨變,并導致股市崩盤,市值達數萬億美元。從那時起,全世界才真正開始關注這位神秘的中國AI企業家。
Ha:那么Saritha,DeepSeek的R1模型有何突破性之處?
Rai:直到最近,人工智能行業一直在投入數十億美元來構建用于訓練模型的基礎設施、數據中心和圖形處理單元。但DeepSeek所做的是,它證明了其模型在某些基準測試中可以匹敵甚至超越最新的OpenAI或Anthropic模型,而且所需的計算能力和資源都遠遠少于后者,正如DeepSeek所聲稱的那樣,其資金也遠少于后者。
哈:梁和他的團隊是如何實現真正的創新的——而且成本只是其中很小的一部分?DeepSeek的成功對中美之間的人工智能競賽意味著什么?這些我們稍后再談。
哈:過去十年的大部分時間里,美國一直試圖限制中國獲取半導體。2022年及次年,緊張局勢達到頂峰,華盛頓針對北京實施了兩輪芯片出口管制。
JonErlichman:在拜登政府表示將加強對中國人工智能芯片出口的限制后,英偉達和半導體公司的股價今日暴跌,現在英偉達向彭博社表示......
哈:這限制了英偉達等美國公司的銷售,這些公司的尖端芯片被科技公司用來幫助訓練他們的人工智能模型。此舉給中國的開發者帶來了重大挑戰,但正如彭博社的薩里塔·拉伊所說,這也迫使他們想方設法解決問題。
Rai:需求永遠是創新之母。這一點已被中國的人工智能開發者證明,盡管面臨出口限制,他們仍然構建了優秀的模型,并與全球頂尖水平進行了對標。
哈:DeepSeek最具創新性的方法之一就是我們之前提到的稀疏性技術。
Rai:稀疏性指的是在不具備高端計算能力的情況下構建模型。這意味著大型語言模型無需完全依賴其資源即可給出查詢答案。Liang和他的同事們嘗試將模型的專業知識分配到更小的專家組中,然后只利用那些需要用到的專家組。這樣做不僅提高了計算效率,也降低了成本。
哈:從根本上來說,你不是用整個大腦,而是只用大腦的某些部分來進行計算嗎?
Rai:完全正確,Oanh。你知道,它不會完全調動你大腦里的每個小灰細胞,而是只激活那些包含特定專業領域的神經元或大腦小部分。然后利用這些神經元或小部分來響應查詢或回答特定問題,無論是命令還是編碼問題。
哈:稀疏性方面的突破給DeepSeek的競爭對手留下了深刻的印象,但最終登上頭條的卻是其價格。DeepSeek表示,其V3模型的訓練成本僅為560萬美元——遠低于OpenAI在其最先進版本的ChatGPT上花費的約1億美元。
雷:現在肯定有很多人對這個數字持懷疑態度,因為僅僅是基礎設施、模型訓練、人才以及所需的時間,加起來就是一筆相當可觀的資金。所以,這種懷疑是有道理的。人們估計,如果沒有至少10億美元甚至更多的資金,DeepSeek根本不可能實現這個目標。
哈:DeepSeek的另一個優勢在于,像它這樣的人工智能初創公司在中國政府和國家主席習近平的領導下擁有堅定的盟友。薩里塔表示,習近平認為生成式人工智能、機器人技術和其他高科技發展方向有利于國家議程,而這正是推動關鍵技術自主化的宏偉計劃的一部分。DeepSeek的成功也促使阿里巴巴、騰訊和字節跳動等規模更大的競爭對手紛紛發布自己的人工智能模型。
Ha:Saritha,DeepSeek的模型目前已經完全開源。這意味著任何個人或公司都可以將DeepSeek的算法整合到自己的程序中。為什么公司選擇這種方式?為什么這種方式很重要?
Rai:開源,從某種程度上來說,可以說是讓人工智能民主化,并將其推向世界。但我們不要忘記,如果中國的人工智能模型是專有模型,并且成本與OpenAI等西方公司相當,那么在全球范圍內,接受者會更少。通過降低成本并開源,中國讓世界各地的人們能夠快速了解??并開始使用模型,從而使它們在商業和人工智能生態系統中更快地被采用,從而超越OpenAI等公司。這意義重大。這不僅關乎模型的民主化,更是戰略性地確保你通過降低成本來擊敗競爭對手,以便世界迅速采用它,并使其成為主流。
Ha:因此,微軟和亞馬遜都在其云服務中提供DeepSeek。DeepSeek的模型已被整合到Perplexity中,Perplexity是一款人工智能搜索引擎,同時還提供OpenAI和Anthropic的模型。
Rai:人工智能的發展速度確實令人擔憂,全世界都擔心所有的控制權都掌握在一兩家公司手中。我認為這正是DeepSeek和其他公司試圖向世界傳遞的信息,即所有的控制權不能都掌握在一兩家公司手中,他們構建的專有模型也應該更加民主。因此,我認為開源理念的重點在于降低風險、集中精力,并允許更多人利用更容易獲得的技術進行構建。
哈:在構建人工智能時,西方方法和中國方法之間是否也存在某種文化沖突或價值觀沖突?
雷:非常清楚,因為如果你觀察DeepSeek的早期模型,甚至是未經調整或微調的模型,你會發現它們基本上都在中國的審查規則框架內運行。例如,你無法向它詢問有關臺灣或習近平的問題,它只會給出一個非常平淡的官方答案。然而,如果你使用同一個模型,并用其他數據對其進行訓練,使其在文化上適應不同的地域,這就是DeepSeek早期學到的一點:通過開源模型,并讓開發者和用戶有機會根據自己的文化背景進行定制,DeepSeek可以更快地在全球范圍內被采用,而不是控制大部分模型,并使其只能在世界各地提供對中國友好的答案。
哈:盡管一些人對中國在人工智能領域的創新表示贊賞,但美國許多人懷疑其成功背后隱藏著更黑暗的原因。美國眾議院委員會4月份發布的一份報告指控DeepSeek與中國政府之間存在“重大”聯系。報告得出結論,該公司非法竊取了OpenAI的數據。中國大使館否認這些指控,稱其毫無根據。與此同時,DeepSeek和梁尚未對眾議院的這份報告發表評論。
哈:薩麗莎,目前看來,在人工智能領域似乎存在著某種軍備競賽,尤其是在美國和中國之間。
雷:這就像一場比賽,我認為現在就斷言勝負還為時過早。我只能說,一年前,我不會認為這是一場勢均力敵的比賽。這是一場馬拉松,但你必須以沖刺的速度前進。我們真的才剛剛起步,無論哪個國家最終獲勝,都將獲得巨大的經濟收益。因此,每個國家,尤其是美國和中國,都不想在人工智能領域松懈。
Ha:您認為DeepSeek目前面臨哪些挑戰?
雷:我認為主要挑戰之一是下一步該做什么?他們能做什么來超越他們已經做過的事情?但我認為,對于DeepSeek來說,在其本土市場也面臨著競爭。阿里巴巴、字節跳動和騰訊等許多中國公司正在構建超越DeepSeek上一個旗艦模型的模型。因此,DeepSeek面臨著做得更好的壓力。但我認為,將這些模型商業化也存在一個問題。像DeepSeek這樣的公司將如何盈利?DeepSeek是否想盈利,如果想盈利,又將如何盈利,目前尚無明確的答案。
本文“人工智能”來源:http://www.rrkkj.com/shishi/6515.html,轉載必須保留網址。







