中国AI公司的创造力正技惊四座
最近几天一家名为深度求索(DeepSeek)的中国公司在欧美AI圈引起了不小的震动甚至被认为是大模型行业的最大“黑马”DeepSeek被不少外国人称为“神秘的东方力量”
1月27日,DeepSeek应用登顶苹果美国地区应用商店免费App下载排行榜,在美区下载榜上超越了ChatGPT。同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。
苹果美国区应用商店
苹果APP Store中国区免费榜
而把开源模型做到全球第一
和公司团队开发
大模型“DeepSeek-V3”的
科技创业者
是来自广东湛江的梁文锋
近日
这名85后还现身《新闻联播》
以AI初创公司深度求索(DeepSeek)
创始人的身份参加了一场
国家超高规格座谈会,并现场发言
他发言的照片
流传于各类社交平台
梁文锋土生土长的湛江人初中就学完了高中数学梁文锋从小成绩优异小学六年级时他就通过考试被吴川一中录用在吴川一中完成了初中、高中学业一直是学校里的“尖子生”并在数学学科表现出极大天赋
“他初中就学完高中的数学,甚至已经开始学大学的数学,数学思维能力很强。”梁文锋的初中班主任容先生表示,初中时期的梁文锋性格很文静,但不是书呆子,他在学习上很有自己的“一套方法”,很注重劳逸结合,仿佛不需要花很多时间来学习就可以学好每一个学科。
最后一排右边第6个是梁文锋。
2002年,梁文锋17岁,他以吴川一中高考第一名的成绩考上浙江大学本科电子信息工程专业,于2007年考上浙江大学信息与通信工程专业研究生。据悉,在大学期间,梁文锋就与同学一起开始积累市场行情数据和探索全自动量化交易。
2023年,梁文锋创立深度求索品牌DeepSeek。
DeepSeek是什么?
为何技惊四座?
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。
几天前,总部位于中国杭州的DeepSeek发布推理模型R1,在性能逼近OpenAI o1正式版的同时,推理成本却仅为后者的几十分之一。
纽约时报称,DeepSeek大模型以极低成本(600万美元)和少量芯片(2000块)实现了与OpenAI等巨头相媲美的性能,挑战了“唯有科技巨头才能研发尖端AI”的行业共识。
低成本实现高性能模型研发,对用户来说的体验感也立竿见影——它功能强大,但却免费使用,并且DeepSeek还将代码面向开发者进行了开源。
据了解,DeepSeek R1没有使用业内普遍使用的监督微调(SFT)训练范式,而是直接通过强化学习让模型自主进化出复杂的推理能力,包括反思和长链思考等能力。这种方法不仅提高了训练效率,还减少了对昂贵计算资源的依赖。与OpenAI的o1相比,DeepSeek模型的百万token输入成本从15美元锐减到0.55美元,输出成本则从60美元降低到2美元。
有人提出,DeepSeek恰恰是美国对华进行芯片出口限制之下所激发出的创新。
对此,网友们也纷纷评论点赞
据悉,今年春节梁文锋会回来湛江吴川过年
来源:广州日报
编辑:张皓玥| 责编:苏琦琦
审核:杜红丽 | 终审:邹燕
请输入验证码