冲击美股,特朗普发声!这群中国年轻人干了票大的
创始人
2025-01-28 12:51:19
0

  近期,DeepSeek成了蛇年春节以外,最火的关键词。

  冲击美股,英伟达、特朗普最新发声

  当地时间27日,欧美科技股重挫。截至收盘,英伟达跌近17%,市值蒸发近6000亿美元,创下单日跌幅新高。市场分析认为,美股暴跌是因中国人工智能初创公司DeepSeek带来的冲击所致。

  福布斯报道,该公司首席执行官、最大个人股东黄仁勋净资产在收盘时缩水了208亿美元。此外,多家芯片制造商以及为AI和数据中心供电的全产业链公司齐跌。博通跌超17%,甲骨文、台积电跌超13%。

  外媒报道,英伟达在27日的声明中表示,“DeepSeek的表现说明了如何利用技术创建新模型,(也就是如何)利用广泛可用的模型和完全符合出口管制的计算(创建新模型)。”

  报道称,英伟达认为,DeepSeek取得的进步表明市场对其芯片仍有需求,“推理需要大量的英伟达GPU和高性能网络。”

  当地时间27日,美国总统特朗普在佛罗里达州迈阿密举行的共和党会议上表示,DeepSeek的崛起应当为美国企业敲响“警钟”,美国公司“需要专注于竞争以赢得胜利。”

  “当你听说有人提出了某些新东西,我们总是有想法。”特朗普称,“所以,我认为这是积极的。这可能是非常积极的发展。因此,与其投入数十亿资金,不如花费更少的(资源),但愿能得出同样的解决方案。”

  遭恶意攻击,DeepSeek紧急公告

  1月28日消息,DeepSeek于服务状态页面公告称:近期DeepSeek线上服务受到大规模恶意攻击。

  截止28日上午11时,DeepSeek仍是苹果App Store下载排行榜第一。

  2024年底,DeepSeek发布了新一代大语言模型V3,并宣布开源。测试结果显示,该模型在多项评测中表现优于主流开源模型,且具有成本优势。

  本月,DeepSeek在世界经济论坛2025年年会开幕当天发布了最新开源模型R1,再次引发全球关注。

  据介绍,R1模型在技术上实现了重要突破——用纯深度学习方法让AI自发涌现出推理能力,在数学、代码、自然语言推理等任务上,性能比肩OpenAI的o1模型正式版,且训练成本仅为560万美元,远低于美国科技巨头的数亿美元乃至数十亿美元投入。

  团队揭秘,DeepSeek背后的年轻人们

  DeepSeek创始人梁文锋,是吴川市覃巴镇米历岭村人,一名85后。

  梁文锋从小成绩优异,小学六年级时,他通过考试被吴川一中录用,并在此完成了初中、高中学业。当时的梁文锋一直是学校里的“尖子生”,尤其在数学学科表现出相当的天赋。

  “他初中就学完高中的数学,甚至已经开始学大学的数学,数学思维能力很强。”梁文锋的初中班主任容先生表示,初中时期的梁文锋性格很文静,但不是书呆子。

  2002年,17岁的梁文锋以吴川一中“高考状元”的成绩考上浙江大学本科电子信息工程专业,于2006年考上浙江大学信息与通信工程专业研究生。据悉,在大学期间,梁文锋就与同学一起开始积累市场行情数据和探索全自动量化交易。

  2023年,梁文锋创立深度求索品牌DeepSeek。

  据报道,DeepSeek的员工规模不到140人,是Open AI的十分之一左右。据领英网站检索样本发现,DeepSeek员工85%以上拥有硕士学位,40%以上有博士学位。团队成员平均年龄约为28岁,90后占比超75%,95后(1995年后出生)员工占比50%以上。

  该公司成员大多毕业于北大、清华、中科大等国内顶尖院校,也有少数毕业于麻省理工学院、卡内基梅隆大学等海外知名高校。同时DeepSeek的员工中也有相当一部分具有交叉学科背景。

  去年年底,95后“天才女生”罗福莉,因为被雷军以千万年薪聘请走红。而她,就是DeepSeek开源大模型DeepSeek-V2的关键开发者之一。

  外界称她为“AI天才少女”,但罗福莉认为自己是“计算机领域绝对的‘低起点’者。2021年6月,罗福莉在个人公众号中发文介绍自己的成长经历,称她是从一个小城市的高中考到北京师范大学,误打误撞进入计算机专业。刚上大一时迷惘不知所向,期末排名也是靠后,大二才开始慢慢振作起来专注于学习。还曾受到“你没有天赋做科研”的评价,大四曾一度考虑转行做产品。

  转折点发生在研究生阶段。罗福莉被保研至北京大学计算语言学专业后,在人工智能领域顶级国际会议ACL上发表8篇论文(其中2篇一作),登上了知乎热搜,一夜爆红。

  公开资料显示,硕士毕业后,罗福莉先是进入阿里达摩院做人工智能研究,从事预训练语言模型相关的工作。2022年,罗福莉加入幻方量化从事深度学习相关策略建模和算法研究,后又跳槽到DeepSeek担任深度学习研究员,参与研发MoE大模型DeepSeek-V2。

  另据南方人物周刊报道,2023年5月,DeepSeek-V2发布,相比于国内外主流大模型,大幅减少了计算量和推理显存,一问世就备受关注。做出这一突破性创新的,是年轻的高华佐和曾旺丁等人。

  两人都刚从学校出来没几年。高华佐来自广东,2012年在华南师范大学附属中学就读时,曾获第29届全国中学生物理竞赛一等奖,并于次年保送至北京大学物理学院学习。曾旺丁来自湖南省新化县,2017年至2023年就读于北京邮电大学人工智能学院,硕士期间主要学习人工智能方向,2018年曾获全国大学生数学竞赛(非数学类)二等奖。

  DeepSeek大模型的另一大突破,是通过一种名为GRPO的算法,创新训练方法,大大降低了成本。其中的主角,依然是这些看似缺少经验的年轻人。

  核心成员之一邵智宏此前是清华大学交互式人工智能(CoAI)课题组博士生,主要研究自然语言处理、深度学习,对构建稳健且可扩展的AI系统有着独特见解。他曾服务于微软研究院,加入DeepSeek团队之后,参与了多个重要项目的研发,包括DeepSeek-Math、DeepSeek-Prover和DeepSeek-Coder-v2等。

  GRPO算法创新的另一重要贡献者是朱琪豪。这位北京大学计算机学院2024届的博士毕业生,专注于深度代码学习研究。在校期间,他展现了惊人的学术能力,发表CCF(中国计算机学会)-A类论文16篇,获得了软件工程领域顶级会议(ESEC/FSE)杰出论文奖。他的博士论文《语言定义感知的深度代码学习技术及应用》入选了2024CCF软件工程专业委员会博士学位论文激励计划。他在DeepSeek团队最重要的工作,正是基于自己的博士论文,主导开发DeepSeek大模型的一个关键项目。

  他的同学代达劢则在更早的时候加入这个团队,参与了DeepSeek大模型从V1到V3每一代的研发,已经是元老级研发人员,也在学生时代获得多项论文奖。

  如此年轻的团队,或许与DeepSeek比较“另类”的选人标准有关:DeepSeek喜欢“高潜力年轻人”。

  据“智能涌现”,一名曾与DeepSeek有过合作的猎头表示,DeepSeek非常偏爱没有工作经验的年轻人,而且指明不要资深人士,“工作经验在3~5年已经是最多的了,工作超8年的基本就pass了”。

  梁文锋曾在采访中表示,留住年轻人才的方法主要是“高薪”和“算力管够”两条路。业内人士表示,DeepSeek的薪资水平能够对标业内任何顶尖机构,而且人才如果在其他公司取得offer,DeepSeek还会加码竞争。

  此外,梁文锋在公司内部推行扁平化管理,并且鼓励员工个人发挥潜能进行学习和创新。DeepSeek也不会采用互联网巨头常用的“赛马”机制,减少团队内耗。在算力资源的调配上,梁文锋对每个人都不设上限,只要提出有潜力的思路,他都会给员工调拨足够的资源进行尝试研究。

  来源:中国新闻网综合央视新闻、DeepSeek官方网站、环球网、红星新闻、湛江发布、南方人物周刊等

相关内容

DeepSeek再发新模型
  中新网1月28日电(中新财经记者 吴家驹) 1月28日凌晨,人...
2025-01-28 14:11:40
冲击美股,特朗普发声!这群...
  近期,DeepSeek成了蛇年春节以外,最火的关键词。  冲击...
2025-01-28 12:51:19
特朗普“星际之门”计划遭马...
  中新网1月23日电 综合外媒报道,美国总统特朗普宣布“星际之门...
2025-01-23 10:09:56
继谷歌、OpenAI后,微...
  中新网1月10日电 综合外媒报道,微软公司9日证实,承诺向美国...
2025-01-10 10:21:21
OpenAI最新模型o3展...
  12月20日,美国开放人工智能研究中心(OpenAI)介绍了其...
2024-12-26 08:37:37
外媒:马斯克要求美法院阻止...
  中新网12月2日电 据美国消费者新闻与商业频道(CNBC)报道...
2024-12-02 15:26:23

热门资讯

200余件伊朗精美文物在新疆展... 12月11日,新疆乌鲁木齐市,正在新疆博物馆展出的“古波斯的荣耀——伊朗文物精华展”吸引众多市民和游...
大同“佛小伴”出圈背后:“云州...   中新网大同11月28日电 (胡健 马静波 宋佳烨)进入旅游淡季,山西北部城市大同仍有不少游客...
中国银行贵州省分行原党委委员、...   中新网12月16日电 据中央纪委国家监委驻中国银行纪检监察组、天津市纪委监委消息:中国银行贵州...
广东侨乡潮州“大吴会客厅”吸引... 广东侨乡潮州,大吴村的“大吴会客厅”吸引村民游客休闲游玩。中新社记者 陈楚红 摄 广东侨乡潮州,大吴...
2024年全国跳伞锦标赛在江西... 图为比赛开幕式上的涡喷航模表演吸引观众观看。中新社记者 刘力鑫 摄图为比赛开幕式上的跳伞表演。中新社...
曾出演朱丽叶的女演员奥丽维亚·...   中新网12月29日电 据英国《卫报》、英国广播公司(BBC)报道,当地时间12月27日,曾在电影...
跨年夜:长沙造雪狂欢迎接202... 12月31日晚,长沙文和友举办了一场怀旧跨年活动,现场通过20世纪80年代的歌舞表演伴随着人工造雪,...
第二十二届中国职业模特大赛总决... 12月21日晚,第二十二届中国职业模特大赛总决赛在北京举办。图为参赛选手进行泳装展示。中新社记者 赵...
重庆万州:古红桔丰收 果农笑开... 图为果农挑着古红桔下山。侯本艳 摄图为果农架梯采摘古红桔。侯本艳 摄图为果农将采摘的古红桔送到收购点...
赣粤山水画名家邀请巡回展在广州...   中新网广州11月28日电 (记者 程景伟)“画笔壮山河—赣粤山水画名家邀请巡回展”广州展27日在...