业界动态
直播回顾:大模型与DeepSeek,技术、应用与未来
2025-03-21 08:34


2. DeepSeek 国产之光,这个荣誉奖励的或者说鼓励的是什么?


首先回答一个问题,DeepSeek的创新是从0到1的颠覆式创新吗?


这个不是的。是1-n上的创新,原有算法基础上的部分算法创新,系统性的工程创新。这个可以有三点解释


a.模型架构环节:大为优化的Transformer + MOE组合架构


降低成本:这两个技术都是谷歌率先提出并采用的,但DeepSeek用它们设计自己的模型时做了巨大优化,并且首次在模型中引入多头潜在注意力机制(Multi-head Latent Attention,MLA),从而大大降低了算力和存储资源的消耗。


普通人能听懂的:激活大脑中的一部分功能来解决问题,不需要牵一发而动全身,这样减少了计算量,减少了消耗。


b.模型训练环节:FP8混合精度训练框架


提升速度:传统上,大模型训练使用32位浮点数(FP32)格式来做计算和存储,这能保证精度,但计算速度慢、存储空间占用大。如何在计算成本和计算精度之间求得平衡,一直是业界难题。2022年,英伟达、Arm和英特尔一起,最早提出8位浮点数格式(FP8),但因为美国公司不缺算力,该技术浅尝辄止。DeepSeek则构建了FP8 混合精度训练框架,根据不同的计算任务和数据特点,动态选择FP8或 FP32 精度来进行计算,把训练速度提高了50%,内存占用降低了40%。


普通人能听懂的:举个例子,算数学 11.11111111111×12.121212121212,算起来很复杂,而且结果也很长,简化一下,算11×12,口算基本上就能得到131,但是这个是相似值,如何又能保留更精准的呢,算11.11 ×12.12 还是11.1111×12.1212,哪个能满足最低精度要求即可。


c.算法环节:新的强化学习算法GRPO


进化速度更快,未来可期:强化学习的目的是让计算机在没有明确人类编程指令的情况下自主学习、自主完成任务,是通往通用人工智能的重要方法。强化学习起初由谷歌引领,训练AlphaGo时就使用了强化学习算法,但是OpenAI后来居上,2015年和2017年接连推出两种新算法TRPO(Trust Region Policy Optimization,信任区域策略优化)和PPO (Proximal Policy Optimization,近端策略优化),DeepSeek更上层楼,推出新的强化学习算法GRPO( Group Relative Policy Optimization 组相对策略优化),在显著降低计算成本的同时,还提高了模型的训练效率。 (GRPO算法公式。Source:DeepSeek-R1论文)


普通人能听懂的:算法的优化,就是一个方法的优化,节省步骤。原来完成一个事情需要a-b-c-d-e 5个步骤,现在可能是a-c-e 或 a-f-e 或 a-b-f,也可以到达,甚至到达的更远。


3.中美大模型差异有多大,一开始有多大,现在有多大,未来有多大?


还是很大,现在是中国取得阶段性成果,美国暂时领先,还在激烈追赶中。


谁是玩家


DeepSeek+Kimi+阿里,百度,字节等 vs OpenAI,Anthropic、谷歌、meta、xAI 等


4.未来决定性因素


现在来讲,人和创新精神是很重要的,但是芯片也是很重要的,就看谁能够在后续的推理模型中持续的去进行创新,继续的去发布出来更好的模型,所以Deepseek问世之后,可以标志着大模型的角逐由上半场转到下半场。


这里分享一句话共勉:

迫不得已是创新之母

The necessity is the mother of the invention

总体来说,DeepSeek的诸多创新在很大程度上来自于芯片受限所带来的挑战。由于只能使用性能相对较低的H800芯片进行训练,DeepSeek被迫在算法层面进行深度优化,以弥补算力的不足。这些创新使得模型更加轻量化,不仅减少了代码的冗余,还提高了能耗效率,使得在计算资源有限的情况下也能高效运行。


更重要的是,DeepSeek符合国内的法律法规要求,并在训练过程中针对国内网络和互联网监管进行了适配。这使得其输出内容完全符合国内的信息监管标准,为国内用户提供了更加安全、合规的服务。相比之下,虽然Chatgpt等模型也表现出色,但在国内可能面临合规性问题。而DeepSeek则通过其独特的优势,特别是针对中文场景的优化和合规性设计,使其更加贴近国内用户的需求,从而在国内市场如惊雷般响彻东西南北。


Part 4

问:AI会给原有机器人领域带来什么变化?

答:AI和机器人的结合正在逐渐加强。简单来说,可以把AI看成是一种软件,AI技术如计算机视觉和自然语言处理是核心,它们的发展推动了机器人技术的智能化,使机器人能够自主决策。这就是未来五年内,甚至更长时间的发展趋势。


如今,机器狗等机器人产品已经在市场上销售,价格逐渐亲民,使得更多行业能够承担得起并应用这些技术。在泰山等景区,机器狗已经被用于搬运行李等任务。这不仅展示了AI技术在推动机器人领域发展方面的巨大潜力,也预示着未来机器人将在更多领域得到广泛应用。


随着AI行业的不断发展,对机器人等硬件行业也有积极的带动。未来,机器人领域将迎来更多的创新和突破,不仅在无人机、军事等行业发挥重要作用,还将在服务业等民用领域越来越普及。例如,现在许多酒店已经开始使用机器人进行送餐服务,这种趋势未来将会更加明显。


Part 5

问:AI行业发展到哪个阶段


答:在AI行业中,分层相对清晰。头部玩家,即大型科技公司,他们拥有雄厚的资金和资源,专注于开发自己的大模型,无论是大语言模型还是视频模型。而中小科技公司则扮演着产品经理的角色,将这些大模型包装成产品,通过APP、网站或插件等形式,帮助用户解决实际问题。


在国内,像阿里这样的头部厂商已经推出了一系列的大模型,形成了一个相对完整的布局。他们不仅在大语言模型和视频模型领域有所建树,还拥有自己的品牌和产品体系。然而,这种趋势也可能导致国内模型市场的垄断。因此,中小科技公司通常会选择开发垂直领域的应用,以差异化竞争。


例如,百川医疗专注于医疗领域的痛点和需求,提供专业的解决方案;而微度科技则在视频领域进行深度开发。这样的分层和差异化发展,使得AI行业能够更加健康、多元地发展。


Part 6

问:AI对于经济和社会的发展是积极的还是消极的?


答:AI时代的突然到来,无疑会对各行各业产生深远影响。它不仅推动了经济从要素驱动向创新驱动的转变,这一转变在经济学术语中常被称为“创新”,而且还提升了各行业的生产和运营效率,催生了新的产业形态和商业模式。

    以上就是本篇文章【直播回顾:大模型与DeepSeek,技术、应用与未来】的全部内容了,欢迎阅览 ! 文章地址:http://fabua.ksxb.net/news/9674.html 
     文章      相关文章      动态      同类文章      热门文章      栏目首页      网站地图      返回首页 海之东岸资讯移动站 http://fabua.ksxb.net/mobile/ , 查看更多   
最新文章
比亚迪研究:BYD能否成为下一个丰田?
欢迎关注下方公众号阿宝1990,本公众号专注于自动驾驶和智能座舱,每天给你一篇汽车干货,我们始于车,但不止于车。佐思汽研发布
继清华后,这些“双一流”高校官宣本科扩招
好消息!继清华大学宣布今年扩招150人后中国农业大学上海交通大学西安交通大学等学校也官宣了今年将扩招本科生清华大学拟增加150
事关就业!贵州最新发布
各市、自治州人力资源和社会保障局:  为全面落实党中央、国务院和省委、省政府关于高校毕业生就业创业工作的决策部署,深入实
直播回顾:大模型与DeepSeek,技术、应用与未来
2. DeepSeek 国产之光,这个荣誉奖励的或者说鼓励的是什么?首先回答一个问题,DeepSeek的创新是从0到1的颠覆式创新吗?这个不
小鹏汽车:MONA M03 车型三月 OTA 因工信部新规延迟
IT之家 3 月 17 日消息,今日发布小鹏 MONA 答用户问(第 17 期),针对 MONA M03 车型三月 OTA 计划延迟、鸿蒙 NEXT 系统版 App
重磅!事关休假、工资、住房、生育…
近日,中共中央办公厅、国务院办公厅印发《提振消费专项行动方案》,并发出通知,要求各地区各部门结合实际认真贯彻落实。《提振
开展健康讲座,守护居民健康
春季是诺如病毒感染的高发期,为提高社区居民的防范能力,近日,苏州市姑苏区沧浪街道潼泾一社区党委联合姑苏区人社局、沧浪街道
AI来了,员工怎么办?
作为商业领袖,你必须让员工感到自己是组织的正式成员——有权像人类一样工作,同时在每个自动化流程中与AI合作。例如,AI可以快
算力又迎一大单!AI翻倍大牛股一举签下1.95亿元合同
算力行业,又迎来一份大订单。去年营收3.98亿元的云从科技一举拿下了1.95亿元的大单。今日,云从科技微跌0.16%,最新报18.23元/
记者观察丨银行业刮起消费贷“热潮”:发力多元场景、不断压低利率
央广网北京3月19日消息(记者唐婧)据中央广播电视总台经济之声《环球新财讯》报道,近期中办、国办发布的《提振消费专项行动方