业界动态
直播回顾:大模型与DeepSeek,技术、应用与未来
2025-03-21 08:34


2. DeepSeek 国产之光,这个荣誉奖励的或者说鼓励的是什么?


首先回答一个问题,DeepSeek的创新是从0到1的颠覆式创新吗?


这个不是的。是1-n上的创新,原有算法基础上的部分算法创新,系统性的工程创新。这个可以有三点解释


a.模型架构环节:大为优化的Transformer + MOE组合架构


降低成本:这两个技术都是谷歌率先提出并采用的,但DeepSeek用它们设计自己的模型时做了巨大优化,并且首次在模型中引入多头潜在注意力机制(Multi-head Latent Attention,MLA),从而大大降低了算力和存储资源的消耗。


普通人能听懂的:激活大脑中的一部分功能来解决问题,不需要牵一发而动全身,这样减少了计算量,减少了消耗。


b.模型训练环节:FP8混合精度训练框架


提升速度:传统上,大模型训练使用32位浮点数(FP32)格式来做计算和存储,这能保证精度,但计算速度慢、存储空间占用大。如何在计算成本和计算精度之间求得平衡,一直是业界难题。2022年,英伟达、Arm和英特尔一起,最早提出8位浮点数格式(FP8),但因为美国公司不缺算力,该技术浅尝辄止。DeepSeek则构建了FP8 混合精度训练框架,根据不同的计算任务和数据特点,动态选择FP8或 FP32 精度来进行计算,把训练速度提高了50%,内存占用降低了40%。


普通人能听懂的:举个例子,算数学 11.11111111111×12.121212121212,算起来很复杂,而且结果也很长,简化一下,算11×12,口算基本上就能得到131,但是这个是相似值,如何又能保留更精准的呢,算11.11 ×12.12 还是11.1111×12.1212,哪个能满足最低精度要求即可。


c.算法环节:新的强化学习算法GRPO


进化速度更快,未来可期:强化学习的目的是让计算机在没有明确人类编程指令的情况下自主学习、自主完成任务,是通往通用人工智能的重要方法。强化学习起初由谷歌引领,训练AlphaGo时就使用了强化学习算法,但是OpenAI后来居上,2015年和2017年接连推出两种新算法TRPO(Trust Region Policy Optimization,信任区域策略优化)和PPO (Proximal Policy Optimization,近端策略优化),DeepSeek更上层楼,推出新的强化学习算法GRPO( Group Relative Policy Optimization 组相对策略优化),在显著降低计算成本的同时,还提高了模型的训练效率。 (GRPO算法公式。Source:DeepSeek-R1论文)


普通人能听懂的:算法的优化,就是一个方法的优化,节省步骤。原来完成一个事情需要a-b-c-d-e 5个步骤,现在可能是a-c-e 或 a-f-e 或 a-b-f,也可以到达,甚至到达的更远。


3.中美大模型差异有多大,一开始有多大,现在有多大,未来有多大?


还是很大,现在是中国取得阶段性成果,美国暂时领先,还在激烈追赶中。


谁是玩家


DeepSeek+Kimi+阿里,百度,字节等 vs OpenAI,Anthropic、谷歌、meta、xAI 等


4.未来决定性因素


现在来讲,人和创新精神是很重要的,但是芯片也是很重要的,就看谁能够在后续的推理模型中持续的去进行创新,继续的去发布出来更好的模型,所以Deepseek问世之后,可以标志着大模型的角逐由上半场转到下半场。


这里分享一句话共勉:

迫不得已是创新之母

The necessity is the mother of the invention

总体来说,DeepSeek的诸多创新在很大程度上来自于芯片受限所带来的挑战。由于只能使用性能相对较低的H800芯片进行训练,DeepSeek被迫在算法层面进行深度优化,以弥补算力的不足。这些创新使得模型更加轻量化,不仅减少了代码的冗余,还提高了能耗效率,使得在计算资源有限的情况下也能高效运行。


更重要的是,DeepSeek符合国内的法律法规要求,并在训练过程中针对国内网络和互联网监管进行了适配。这使得其输出内容完全符合国内的信息监管标准,为国内用户提供了更加安全、合规的服务。相比之下,虽然Chatgpt等模型也表现出色,但在国内可能面临合规性问题。而DeepSeek则通过其独特的优势,特别是针对中文场景的优化和合规性设计,使其更加贴近国内用户的需求,从而在国内市场如惊雷般响彻东西南北。


Part 4

问:AI会给原有机器人领域带来什么变化?

答:AI和机器人的结合正在逐渐加强。简单来说,可以把AI看成是一种软件,AI技术如计算机视觉和自然语言处理是核心,它们的发展推动了机器人技术的智能化,使机器人能够自主决策。这就是未来五年内,甚至更长时间的发展趋势。


如今,机器狗等机器人产品已经在市场上销售,价格逐渐亲民,使得更多行业能够承担得起并应用这些技术。在泰山等景区,机器狗已经被用于搬运行李等任务。这不仅展示了AI技术在推动机器人领域发展方面的巨大潜力,也预示着未来机器人将在更多领域得到广泛应用。


随着AI行业的不断发展,对机器人等硬件行业也有积极的带动。未来,机器人领域将迎来更多的创新和突破,不仅在无人机、军事等行业发挥重要作用,还将在服务业等民用领域越来越普及。例如,现在许多酒店已经开始使用机器人进行送餐服务,这种趋势未来将会更加明显。


Part 5

问:AI行业发展到哪个阶段


答:在AI行业中,分层相对清晰。头部玩家,即大型科技公司,他们拥有雄厚的资金和资源,专注于开发自己的大模型,无论是大语言模型还是视频模型。而中小科技公司则扮演着产品经理的角色,将这些大模型包装成产品,通过APP、网站或插件等形式,帮助用户解决实际问题。


在国内,像阿里这样的头部厂商已经推出了一系列的大模型,形成了一个相对完整的布局。他们不仅在大语言模型和视频模型领域有所建树,还拥有自己的品牌和产品体系。然而,这种趋势也可能导致国内模型市场的垄断。因此,中小科技公司通常会选择开发垂直领域的应用,以差异化竞争。


例如,百川医疗专注于医疗领域的痛点和需求,提供专业的解决方案;而微度科技则在视频领域进行深度开发。这样的分层和差异化发展,使得AI行业能够更加健康、多元地发展。


Part 6

问:AI对于经济和社会的发展是积极的还是消极的?


答:AI时代的突然到来,无疑会对各行各业产生深远影响。它不仅推动了经济从要素驱动向创新驱动的转变,这一转变在经济学术语中常被称为“创新”,而且还提升了各行业的生产和运营效率,催生了新的产业形态和商业模式。

    以上就是本篇文章【直播回顾:大模型与DeepSeek,技术、应用与未来】的全部内容了,欢迎阅览 ! 文章地址:http://fabua.ksxb.net/news/9674.html 
     文章      相关文章      动态      同类文章      热门文章      栏目首页      网站地图      返回首页 海之东岸资讯移动站 http://fabua.ksxb.net/mobile/ , 查看更多   
最新文章
明确0到2级辅助驾驶系统 “人机共驾”法律属性
公安部交通管理局局长王强7月23日在国新办举行的“高质量完成‘十四五’规划”系列主题新闻发布会上表示,为进一步加强规范管理
iPhone 17系列价格曝光:仅一款不涨价 Pro版更具性价比
【TechWeb】近段时间以来,全新iPhone 17系列尤为吸引外界的目光,而根据供应链最新爆料,iPhone 17系列距离亮相仅剩差不多一个
管庄回收茅台酒!管庄茅台酒回收!
137=1888=0048 回收茅台礼盒15年 30年 50年 80年茅台礼盒回收洋酒系列 回收路易十三,轩尼诗,拉菲,拉图,马爹利,人头马
北京到陶乐物流专线价格,货到付款
长胜物流24 小时服/务热线:||长途搬家|家电托运|电脑托运|液晶电视托运|冰箱托运|洗衣机托运|行李托运|电动车托运|摩托车托运|
解读Solana最新技术路线图:锚定“互联网资本市场”,打造链上华尔街
昨天 Solana 宣布了新的路线图。本质上,由于各链改进都已进入深水区,导致确实有些名词堆砌的情况,我试着用大家可以理解的方式
国泰海通发布新一代全AI智能APP灵犀
央广网北京7月26日消息(记者樊瑞)当前,人工智能技术正加速重构证券行业服务业态,加快发展新一代人工智能是推动证券行业高质
新加坡地道特色平价美食,好吃不踩雷
新加坡太多美食了~亚坤-咖椰吐司$5左右,这是我在新加坡吃的第一顿早餐。不知道好不好吃,但看着一大早就好多人排队,那就没错
上海UPS蓄电池回收
上海UPS回收,UPS电源回收,UPS电池回收:上海APC不间断电源回收,UPS主机回收,机房设备回收,回收UPS设备,UPS蓄电池回收,UPS
云边端协同:虚拟电厂的“神经网”革命
上海某高校586台空调在50秒内无感降负300kW,精度96.57%;重庆虚拟电厂调度17MW可调资源,延迟压缩至100ms级——这组数据的背后
高金食品与远方好物达成战略合作,让高品质“真黑猪”走进千家万户的餐桌
中国黑猪看四川,四川黑猪看高金。高金食品正用“真黑猪”,破局本土黑猪市场占有率困境,开创中国黑猪产业新篇章。7月23日,在