DeepSeek是啥_杭州一家公司,突然爆火!今天所有人都在討論的“DeepSeek”,究竟是啥?最近引發(fā)大家的關(guān)注,相信大家都想知道這件事會有怎么樣的發(fā)展?下面就讓小編為大家介紹一下,一起來看看吧。

杭州一家公司,突然爆火!今天所有人都在討論的“DeepSeek”,究竟是啥?
### DeepSeek 登頂熱搜,引發(fā)廣泛關(guān)注
1月27日,DeepSeek 應(yīng)用登頂蘋果美國地區(qū)應(yīng)用商店免費APP下載排行榜,在美區(qū)下載榜上超越了ChatGPT。同日,蘋果中國區(qū)應(yīng)用商店免費榜顯示,DeepSeek 成為中國區(qū)第一。
#### 馮驥:震撼的突破
1月26日,游戲科學(xué)創(chuàng)始人、CEO,《黑神話:悟空》制作人馮驥對DeepSeek 評價道:“這可能是一個國運級別的科技成果。” 馮驥表示:“希望DeepSeek R1會讓你對當(dāng)前最先進的AI祛魅,讓AI逐漸變成你生活中的水和電。太幸運了!太開心了!這樣震撼的突破,來自一個純粹的中國公司。知識與信息平權(quán),至此又往前邁出了堅實的一步。”
### DeepSeek 是什么?
DeepSeek,全稱杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,成立于2023年7月17日,是一家專注于開發(fā)先進大語言模型(LLM)及相關(guān)技術(shù)的創(chuàng)新型科技公司。
去年12月,DeepSeek-V3發(fā)布后,AI數(shù)據(jù)服務(wù)公司Scale AI創(chuàng)始人Alexander Wang發(fā)帖稱,DeepSeek-V3是中國科技界帶給美國的苦澀教訓(xùn)?!爱?dāng)美國休息時,中國(科技界)在工作,以更低的成本、更快的速度和更強的實力趕上。”
不到一個月之后,今年1月20日,DeepSeek正式開源R1推理模型。據(jù)DeepSeek介紹,其最新發(fā)布的模型DeepSeek-R1在后訓(xùn)練階段大規(guī)模使用了強化學(xué)習(xí)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力。在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上,性能比肩OpenAI o1正式版。
這一模型發(fā)布后,引發(fā)了海外AI圈眾多科技大佬的討論。例如,英偉達高級研究科學(xué)家Jim Fan就在個人社交平臺上公開發(fā)表推文表示:“我們正身處這樣一個歷史時刻:一家非美國公司正在延續(xù)OpenAI最初的使命——通過真正開放的前沿研究賦能全人類。看似不合常理,但最有趣的結(jié)局往往最可能成真。”
### DeepSeek 的成功之路
DeepSeek之所以能夠出圈,很大程度上得益于其2024年12月26日宣布上線并同步開源的DeepSeek-V3模型。這款模型不僅在性能上超越了GPT-4o,還在成本控制上表現(xiàn)出色。DeepSeek-V3僅用了1/11的算力、約2000個GPU芯片,訓(xùn)練出性能超越GPT-4o的大模型,總訓(xùn)練成本僅為557.6萬美元,而GPT-4o的訓(xùn)練成本約為1億美元,使用了25000個GPU芯片,雙方的成本差距達到了10倍之多。
在性能方面,DeepSeek-V3在數(shù)學(xué)、代碼能力和中文知識問答方面超過了ChatGPT-4o。國外獨立測評機構(gòu)Artificial Analysis測試后,發(fā)出了“超越了迄今為止所有開源模型”的驚嘆;Meta科學(xué)家田淵棟感慨:“這是非常偉大的工作。”
此外,“性價比”是商業(yè)社會中的制勝法寶之一,DeepSeek也因此被稱為“大模型界的拼多多”,引發(fā)了字節(jié)、阿里、百度等大廠的大模型價格大戰(zhàn)。
### 團隊規(guī)模與人才優(yōu)勢
DeepSeek團隊只有139名研發(fā)人員,相比OpenAI擁有1200名研究人員,團隊規(guī)模是DeepSeek的近9倍。其中,算子、推理框架、多模態(tài)等研發(fā)工程師以及深度學(xué)習(xí)方面的研究人員共有約70人。比如前段時間的熱門話題“雷軍千萬年薪挖95后天才AI少女”,這位“95后AI天才少女”羅福莉就是DeepSeek開源大模型DeepSeek-V2的關(guān)鍵開發(fā)者之一。
OpenAI前政策主管、Anthropic聯(lián)合創(chuàng)始人Jack Clark曾評價DeepSeek:“雇用了一批高深莫測的奇才”,還認(rèn)為中國制造的大模型,“將和無人機、電動汽車一樣,成為不容忽視的力量?!?/p>
### 深度求索的創(chuàng)始人梁文鋒
梁文鋒,80后,出生于廣東的一個五線城市,父親是一名小學(xué)老師。他畢業(yè)于浙江大學(xué),主修軟件工程,人工智能方向。17歲時,梁文鋒考入浙大,讀的是電子工程系人工智能方向,畢業(yè)后繼續(xù)在浙大攻讀碩士研究生,論文題目是《基于低成本PTZ攝像機的目標(biāo)跟蹤算法研究》。
2015年,30歲的梁文鋒和朋友一起創(chuàng)辦了杭州幻方科技有限公司,立志成為世界頂級的量化對沖基金。2016年10月,幻方量化推出了第一個AI模型,第一份由深度學(xué)習(xí)生成的交易倉位上線執(zhí)行。到2017年底,幾乎所有的量化策略都采用AI模型計算。
2023年5月,38歲的梁文鋒宣布進軍通用人工智能(AGI)。同年7月,他正式創(chuàng)辦了杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,即DeepSeek公司,專注于AI大模型的研究和開發(fā),公司設(shè)在杭州。
有同事評價梁文鋒:完全不像一個老板,而更像一個極客。作為老板,他本人每天都在寫代碼、跑代碼,學(xué)習(xí)能力驚人。從公開的工作經(jīng)歷和職業(yè)生涯來看,梁文鋒在量化投資和高性能計算領(lǐng)域具有深厚的背景和豐富的經(jīng)驗,創(chuàng)業(yè)范疇橫跨金融和人工智能領(lǐng)域。
### 應(yīng)對服務(wù)器閃崩問題
26日,DeepSeek出現(xiàn)了短時閃崩現(xiàn)象。不少網(wǎng)友反映,使用時遇到“服務(wù)器繁忙”的提示。對此,DeepSeek回應(yīng)稱,當(dāng)天下午確實出現(xiàn)了局部服務(wù)波動,但問題在數(shù)分鐘內(nèi)就得到了解決。此次事件可能是由于新模型發(fā)布后,用戶訪問量激增,服務(wù)器一時無法滿足大量用戶的并發(fā)需求。不過,官方狀態(tài)頁并未將這一事件標(biāo)記為事故。
今天也有消息稱,DeepSeek服務(wù)狀態(tài)頁面顯示,DeepSeek網(wǎng)頁/API不可用,目前正在調(diào)查該問題。對于DeepSeek如何看待“兩天兩崩”,DeepSeek回復(fù)稱,技術(shù)服務(wù)的穩(wěn)定性受多重因素影響,可能涉及突發(fā)流量、系統(tǒng)升級適配或底層基礎(chǔ)設(shè)施的臨時波動等。我們的團隊始終將穩(wěn)定性作為首要任務(wù),并會在每次事件后徹底分析原因,持續(xù)優(yōu)化系統(tǒng)韌性。
總之,DeepSeek憑借其創(chuàng)新的技術(shù)和卓越的性價比,迅速贏得了全球的關(guān)注和認(rèn)可。未來,這家公司將繼續(xù)在AI領(lǐng)域探索更多可能性,為全球用戶提供更優(yōu)質(zhì)的AI服務(wù)。
上述就是關(guān)于DeepSeek是啥_杭州一家公司,突然爆火!今天所有人都在討論的“DeepSeek”,究竟是啥?的全部內(nèi)容了,希望能夠有所幫助。更多相關(guān)攻略和資訊可以關(guān)注我們多特資訊頻道,之后將為大家?guī)砀嗑蕛?nèi)容。
了解更多消息請關(guān)注收藏我們的網(wǎng)站。
鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請第一時間聯(lián)系我們修改或刪除,多謝。



