业界动态
直播回顾:大模型与DeepSeek,技术、应用与未来
2025-03-21 08:34


2. DeepSeek 国产之光,这个荣誉奖励的或者说鼓励的是什么?


首先回答一个问题,DeepSeek的创新是从0到1的颠覆式创新吗?


这个不是的。是1-n上的创新,原有算法基础上的部分算法创新,系统性的工程创新。这个可以有三点解释


a.模型架构环节:大为优化的Transformer + MOE组合架构


降低成本:这两个技术都是谷歌率先提出并采用的,但DeepSeek用它们设计自己的模型时做了巨大优化,并且首次在模型中引入多头潜在注意力机制(Multi-head Latent Attention,MLA),从而大大降低了算力和存储资源的消耗。


普通人能听懂的:激活大脑中的一部分功能来解决问题,不需要牵一发而动全身,这样减少了计算量,减少了消耗。


b.模型训练环节:FP8混合精度训练框架


提升速度:传统上,大模型训练使用32位浮点数(FP32)格式来做计算和存储,这能保证精度,但计算速度慢、存储空间占用大。如何在计算成本和计算精度之间求得平衡,一直是业界难题。2022年,英伟达、Arm和英特尔一起,最早提出8位浮点数格式(FP8),但因为美国公司不缺算力,该技术浅尝辄止。DeepSeek则构建了FP8 混合精度训练框架,根据不同的计算任务和数据特点,动态选择FP8或 FP32 精度来进行计算,把训练速度提高了50%,内存占用降低了40%。


普通人能听懂的:举个例子,算数学 11.11111111111×12.121212121212,算起来很复杂,而且结果也很长,简化一下,算11×12,口算基本上就能得到131,但是这个是相似值,如何又能保留更精准的呢,算11.11 ×12.12 还是11.1111×12.1212,哪个能满足最低精度要求即可。


c.算法环节:新的强化学习算法GRPO


进化速度更快,未来可期:强化学习的目的是让计算机在没有明确人类编程指令的情况下自主学习、自主完成任务,是通往通用人工智能的重要方法。强化学习起初由谷歌引领,训练AlphaGo时就使用了强化学习算法,但是OpenAI后来居上,2015年和2017年接连推出两种新算法TRPO(Trust Region Policy Optimization,信任区域策略优化)和PPO (Proximal Policy Optimization,近端策略优化),DeepSeek更上层楼,推出新的强化学习算法GRPO( Group Relative Policy Optimization 组相对策略优化),在显著降低计算成本的同时,还提高了模型的训练效率。 (GRPO算法公式。Source:DeepSeek-R1论文)


普通人能听懂的:算法的优化,就是一个方法的优化,节省步骤。原来完成一个事情需要a-b-c-d-e 5个步骤,现在可能是a-c-e 或 a-f-e 或 a-b-f,也可以到达,甚至到达的更远。


3.中美大模型差异有多大,一开始有多大,现在有多大,未来有多大?


还是很大,现在是中国取得阶段性成果,美国暂时领先,还在激烈追赶中。


谁是玩家


DeepSeek+Kimi+阿里,百度,字节等 vs OpenAI,Anthropic、谷歌、meta、xAI 等


4.未来决定性因素


现在来讲,人和创新精神是很重要的,但是芯片也是很重要的,就看谁能够在后续的推理模型中持续的去进行创新,继续的去发布出来更好的模型,所以Deepseek问世之后,可以标志着大模型的角逐由上半场转到下半场。


这里分享一句话共勉:

迫不得已是创新之母

The necessity is the mother of the invention

总体来说,DeepSeek的诸多创新在很大程度上来自于芯片受限所带来的挑战。由于只能使用性能相对较低的H800芯片进行训练,DeepSeek被迫在算法层面进行深度优化,以弥补算力的不足。这些创新使得模型更加轻量化,不仅减少了代码的冗余,还提高了能耗效率,使得在计算资源有限的情况下也能高效运行。


更重要的是,DeepSeek符合国内的法律法规要求,并在训练过程中针对国内网络和互联网监管进行了适配。这使得其输出内容完全符合国内的信息监管标准,为国内用户提供了更加安全、合规的服务。相比之下,虽然Chatgpt等模型也表现出色,但在国内可能面临合规性问题。而DeepSeek则通过其独特的优势,特别是针对中文场景的优化和合规性设计,使其更加贴近国内用户的需求,从而在国内市场如惊雷般响彻东西南北。


Part 4

问:AI会给原有机器人领域带来什么变化?

答:AI和机器人的结合正在逐渐加强。简单来说,可以把AI看成是一种软件,AI技术如计算机视觉和自然语言处理是核心,它们的发展推动了机器人技术的智能化,使机器人能够自主决策。这就是未来五年内,甚至更长时间的发展趋势。


如今,机器狗等机器人产品已经在市场上销售,价格逐渐亲民,使得更多行业能够承担得起并应用这些技术。在泰山等景区,机器狗已经被用于搬运行李等任务。这不仅展示了AI技术在推动机器人领域发展方面的巨大潜力,也预示着未来机器人将在更多领域得到广泛应用。


随着AI行业的不断发展,对机器人等硬件行业也有积极的带动。未来,机器人领域将迎来更多的创新和突破,不仅在无人机、军事等行业发挥重要作用,还将在服务业等民用领域越来越普及。例如,现在许多酒店已经开始使用机器人进行送餐服务,这种趋势未来将会更加明显。


Part 5

问:AI行业发展到哪个阶段


答:在AI行业中,分层相对清晰。头部玩家,即大型科技公司,他们拥有雄厚的资金和资源,专注于开发自己的大模型,无论是大语言模型还是视频模型。而中小科技公司则扮演着产品经理的角色,将这些大模型包装成产品,通过APP、网站或插件等形式,帮助用户解决实际问题。


在国内,像阿里这样的头部厂商已经推出了一系列的大模型,形成了一个相对完整的布局。他们不仅在大语言模型和视频模型领域有所建树,还拥有自己的品牌和产品体系。然而,这种趋势也可能导致国内模型市场的垄断。因此,中小科技公司通常会选择开发垂直领域的应用,以差异化竞争。


例如,百川医疗专注于医疗领域的痛点和需求,提供专业的解决方案;而微度科技则在视频领域进行深度开发。这样的分层和差异化发展,使得AI行业能够更加健康、多元地发展。


Part 6

问:AI对于经济和社会的发展是积极的还是消极的?


答:AI时代的突然到来,无疑会对各行各业产生深远影响。它不仅推动了经济从要素驱动向创新驱动的转变,这一转变在经济学术语中常被称为“创新”,而且还提升了各行业的生产和运营效率,催生了新的产业形态和商业模式。

    以上就是本篇文章【直播回顾:大模型与DeepSeek,技术、应用与未来】的全部内容了,欢迎阅览 ! 文章地址:http://fabua.ksxb.net/news/9674.html 
     文章      相关文章      动态      同类文章      热门文章      栏目首页      网站地图      返回首页 海之东岸资讯移动站 http://fabua.ksxb.net/mobile/ , 查看更多   
最新文章
英特尔CEO陈立武:剥离非核心业务,建立世界一流晶圆代工厂!
当地时间3月31日,英特尔在美国拉斯维加斯召开了“Intel Vision”(英特尔愿景)大会,英特尔首席执行官陈立武(Lip-Bu Tan)首
合金弹头游戏合金弹头手机版下载「合金弹头游戏」
相信很多小伙伴们比较喜欢合金弹头游戏吧,那么下面给大家带来2022和合金弹头画风很像的游戏叫什么,这几款游戏给小编带来的整体
广东:商贩偷奸耍滑,缺斤短两,男子气不过,拿锤子怒砸猪肉摊锤子手机老板「广东:商贩偷奸耍滑,缺斤短两,男子气不过,拿锤子怒砸猪肉摊」
广东佛山曾经发生一起事件,男子乘车到菜市场买猪肉,猪肉摊老板告知男子:猪肉36元一斤。男子嫌猪肉太贵,与老板发生冲突,并抢
小米手机会出现漏电和手麻问题?手机漏电「小米手机会出现漏电和手麻问题?」
小米手机漏电和手麻问题解析引言:近期,关于小米手机存在漏电和手麻问题的传闻在社交媒体上广泛流传。用户对于手机安全和健康的
SIM卡成本价1.5-5元 有营业厅补换卡收费30元补手机卡要多少钱「SIM卡成本价1.5-5元 有营业厅补换卡收费30元」
  手机里必需的SIM卡(电话卡)难免出现损坏、丢失的情况。  近日,南都湾财社记者在社交平台上发现,不少用户吐槽运营商补换
【诊疗攻略】吉兰-巴雷综合征诊断+治疗
吉兰-巴雷综合征(Guillain⁃Barré syndrome,GBS)系一类免疫介导的急性炎性周围神经病,包括经典型GBS和变异型 GBS 两大类,
专题 | 2025年地方供地计划探析:规模压降、结构优化与市场效应
2025年初,中国房地产市场延续上年四季度企稳态势,一二手房成交规模与房价指数持续修复,土地市场率先显现积极信号——月度溢价
iPhone9什么时候发售 新iPhone发布时间及上市时间一览苹果手机9「iPhone9什么时候发售 新iPhone发布时间及上市时间一览」
马上就到九月份了,根据往年惯例,全球最受欢迎的手机品牌,苹果将在九月中旬发布2018年度旗舰新iPhone,因此当前关于新iPhone的
QQ支持与TM双向切换吗手机qq下载2012「QQ支持与TM双向切换吗」
  TM是一款面向办公环境中有IM使用需求的用户,较侧重熟人间的沟通和联系的个人即时通讯软件。可与QQ一键双向切换。  在QQ中
这些原研药,在新渠道爆红
文 | vb动脉网随着医改各项措施的全面推进,院内院外药品市场格局重塑,原研药战略重心正从院内市场走向院外。据米内网近期发布