业界动态
直播回顾:大模型与DeepSeek,技术、应用与未来
2025-03-21 08:34


2. DeepSeek 国产之光,这个荣誉奖励的或者说鼓励的是什么?


首先回答一个问题,DeepSeek的创新是从0到1的颠覆式创新吗?


这个不是的。是1-n上的创新,原有算法基础上的部分算法创新,系统性的工程创新。这个可以有三点解释


a.模型架构环节:大为优化的Transformer + MOE组合架构


降低成本:这两个技术都是谷歌率先提出并采用的,但DeepSeek用它们设计自己的模型时做了巨大优化,并且首次在模型中引入多头潜在注意力机制(Multi-head Latent Attention,MLA),从而大大降低了算力和存储资源的消耗。


普通人能听懂的:激活大脑中的一部分功能来解决问题,不需要牵一发而动全身,这样减少了计算量,减少了消耗。


b.模型训练环节:FP8混合精度训练框架


提升速度:传统上,大模型训练使用32位浮点数(FP32)格式来做计算和存储,这能保证精度,但计算速度慢、存储空间占用大。如何在计算成本和计算精度之间求得平衡,一直是业界难题。2022年,英伟达、Arm和英特尔一起,最早提出8位浮点数格式(FP8),但因为美国公司不缺算力,该技术浅尝辄止。DeepSeek则构建了FP8 混合精度训练框架,根据不同的计算任务和数据特点,动态选择FP8或 FP32 精度来进行计算,把训练速度提高了50%,内存占用降低了40%。


普通人能听懂的:举个例子,算数学 11.11111111111×12.121212121212,算起来很复杂,而且结果也很长,简化一下,算11×12,口算基本上就能得到131,但是这个是相似值,如何又能保留更精准的呢,算11.11 ×12.12 还是11.1111×12.1212,哪个能满足最低精度要求即可。


c.算法环节:新的强化学习算法GRPO


进化速度更快,未来可期:强化学习的目的是让计算机在没有明确人类编程指令的情况下自主学习、自主完成任务,是通往通用人工智能的重要方法。强化学习起初由谷歌引领,训练AlphaGo时就使用了强化学习算法,但是OpenAI后来居上,2015年和2017年接连推出两种新算法TRPO(Trust Region Policy Optimization,信任区域策略优化)和PPO (Proximal Policy Optimization,近端策略优化),DeepSeek更上层楼,推出新的强化学习算法GRPO( Group Relative Policy Optimization 组相对策略优化),在显著降低计算成本的同时,还提高了模型的训练效率。 (GRPO算法公式。Source:DeepSeek-R1论文)


普通人能听懂的:算法的优化,就是一个方法的优化,节省步骤。原来完成一个事情需要a-b-c-d-e 5个步骤,现在可能是a-c-e 或 a-f-e 或 a-b-f,也可以到达,甚至到达的更远。


3.中美大模型差异有多大,一开始有多大,现在有多大,未来有多大?


还是很大,现在是中国取得阶段性成果,美国暂时领先,还在激烈追赶中。


谁是玩家


DeepSeek+Kimi+阿里,百度,字节等 vs OpenAI,Anthropic、谷歌、meta、xAI 等


4.未来决定性因素


现在来讲,人和创新精神是很重要的,但是芯片也是很重要的,就看谁能够在后续的推理模型中持续的去进行创新,继续的去发布出来更好的模型,所以Deepseek问世之后,可以标志着大模型的角逐由上半场转到下半场。


这里分享一句话共勉:

迫不得已是创新之母

The necessity is the mother of the invention

总体来说,DeepSeek的诸多创新在很大程度上来自于芯片受限所带来的挑战。由于只能使用性能相对较低的H800芯片进行训练,DeepSeek被迫在算法层面进行深度优化,以弥补算力的不足。这些创新使得模型更加轻量化,不仅减少了代码的冗余,还提高了能耗效率,使得在计算资源有限的情况下也能高效运行。


更重要的是,DeepSeek符合国内的法律法规要求,并在训练过程中针对国内网络和互联网监管进行了适配。这使得其输出内容完全符合国内的信息监管标准,为国内用户提供了更加安全、合规的服务。相比之下,虽然Chatgpt等模型也表现出色,但在国内可能面临合规性问题。而DeepSeek则通过其独特的优势,特别是针对中文场景的优化和合规性设计,使其更加贴近国内用户的需求,从而在国内市场如惊雷般响彻东西南北。


Part 4

问:AI会给原有机器人领域带来什么变化?

答:AI和机器人的结合正在逐渐加强。简单来说,可以把AI看成是一种软件,AI技术如计算机视觉和自然语言处理是核心,它们的发展推动了机器人技术的智能化,使机器人能够自主决策。这就是未来五年内,甚至更长时间的发展趋势。


如今,机器狗等机器人产品已经在市场上销售,价格逐渐亲民,使得更多行业能够承担得起并应用这些技术。在泰山等景区,机器狗已经被用于搬运行李等任务。这不仅展示了AI技术在推动机器人领域发展方面的巨大潜力,也预示着未来机器人将在更多领域得到广泛应用。


随着AI行业的不断发展,对机器人等硬件行业也有积极的带动。未来,机器人领域将迎来更多的创新和突破,不仅在无人机、军事等行业发挥重要作用,还将在服务业等民用领域越来越普及。例如,现在许多酒店已经开始使用机器人进行送餐服务,这种趋势未来将会更加明显。


Part 5

问:AI行业发展到哪个阶段


答:在AI行业中,分层相对清晰。头部玩家,即大型科技公司,他们拥有雄厚的资金和资源,专注于开发自己的大模型,无论是大语言模型还是视频模型。而中小科技公司则扮演着产品经理的角色,将这些大模型包装成产品,通过APP、网站或插件等形式,帮助用户解决实际问题。


在国内,像阿里这样的头部厂商已经推出了一系列的大模型,形成了一个相对完整的布局。他们不仅在大语言模型和视频模型领域有所建树,还拥有自己的品牌和产品体系。然而,这种趋势也可能导致国内模型市场的垄断。因此,中小科技公司通常会选择开发垂直领域的应用,以差异化竞争。


例如,百川医疗专注于医疗领域的痛点和需求,提供专业的解决方案;而微度科技则在视频领域进行深度开发。这样的分层和差异化发展,使得AI行业能够更加健康、多元地发展。


Part 6

问:AI对于经济和社会的发展是积极的还是消极的?


答:AI时代的突然到来,无疑会对各行各业产生深远影响。它不仅推动了经济从要素驱动向创新驱动的转变,这一转变在经济学术语中常被称为“创新”,而且还提升了各行业的生产和运营效率,催生了新的产业形态和商业模式。

    以上就是本篇文章【直播回顾:大模型与DeepSeek,技术、应用与未来】的全部内容了,欢迎阅览 ! 文章地址:http://fabua.ksxb.net/news/9674.html 
     文章      相关文章      动态      同类文章      热门文章      栏目首页      网站地图      返回首页 海之东岸资讯移动站 http://fabua.ksxb.net/mobile/ , 查看更多   
最新文章
“好房子”:层高≥3米,≥4层有电梯
制图:李斌(豆包AI)3月31日,国家标准《住宅项目规范》发布,以安全、舒适、绿色、智慧为目标,在规模、布局、功能、性能和关
iPhone 14 相机拍摄不清晰相机抖动怎么办【详解】苹果手机拍照怎么是反的「iPhone 14 相机拍摄不清晰相机抖动怎么办【详解】」
  自iOS 16发布以来,已经有不少iPhone 14,iPhone13和iPhone12用户反馈自己的设备相机存在问题。具体表现在 iPhone 14 Pro上
华为nova7 Pro体验:依旧是自拍最好的5G旗舰手机!全新手机「华为nova7 Pro体验:依旧是自拍最好的5G旗舰手机!」
华为nova系列作为面向全球年轻人的时尚科技品牌,每一代华为nova系列都通过创新科技,为年轻人群带来潮流娱乐新体验,满足多元化
罗永浩独家回应:锤子手机融资真相,10亿传闻背后的6亿实情!锤子手机老板「罗永浩独家回应:锤子手机融资真相,10亿传闻背后的6亿实情!」
【ITBEAR】9月9日消息,罗永浩今日在微博详尽回应了郑刚对其的诸多质疑,发表了《关于“‘真还传’的七大未解之谜”的回应与澄清
2020年魔幻大瓜盘点?邓伦被嘲十连扑?摩托流量拒绝公主?摩托手机「​2020年魔幻大瓜盘点?邓伦被嘲十连扑?摩托流量拒绝公主?」
​​1.邓伦被嘲十连扑?邓伦也是倒霉,香蜜之后几部作品没有水花,《晴雅集》又继《封神》后接连被下架,邓伦好不容易接触次大荧
iPhone短信误删了?别急,这几招帮你轻松恢复!手机短信一键恢复「iPhone短信误删了?别急,这几招帮你轻松恢复!」
在快节奏的生活中,我们频繁地使用iPhone进行各种操作,包括发送和接收短信。然而,有时候一个不小心,
DeepSeek点燃AI战火,英特尔以三大优势领航AI PC时代
过去一段时间,英特尔遭遇了不少麻烦,如今随着新任CEO陈立武(Lip-Bu Tan)的到来,英特尔正重整旗鼓,开启新篇章。2025年3月29
上海合作组织可持续发展投资促进活动欢迎晚宴举行
4月9日,上海合作组织可持续发展投资促进活动欢迎晚宴举行。市委常委、滨海新区区委书记连茂君致欢迎辞,副市长李文海、上海合作
手机镀膜怎样卸掉呢?手机镀膜「手机镀膜怎样卸掉呢?」
若您希望卸掉手机镀膜,通常情况下可以直接撕开。然而,有时手机镀膜可能由于粘附过紧或其他原因而难以拆卸。在这种情况下,为了
交易员Eugene:7.5万美元时已建仓比特币现货,准备继续囤积并长持
BlockBeats 消息,4 月 7 日,交易员 Eugene Ng Ah Sio 在个人频道发文表示,「今天在比特币 7.5 万美元时,我买入了第一批现货