商务服务
Gemini 2.0来了:一个要做所有AI agent底座的超级模型
2024-12-16 09:48

  OpenAI发布会进入第5天,带来了ChatGPT与Apple设备的集成升级。用户无需ChatGPT账号就能在设置中启用Apple Intelligence扩展,体验Siri的复杂任务转交、内容创作、iPhone 16视觉智能模式,以及macOS上的快捷调用功能。

  演示内容也很简单:用户对Siri说“让ChatGPT…”后,请求即被ChatGPT接管;长按iPhone 16侧边摄像头控制键打开相机,点击“ask”调用ChatGPT分析拍摄内容;在macOS双击Command键激活ChatGPT,快速分析提炼长PDF文档信息。

  直播仅持续12分钟,由于大多早已在Apple的demo中见过,整体看来平平无奇。

  而今天真正的高光时刻,来自Google。

  Gemini 2.0 Flash以低延迟和增强性能为核心,代表了Google在AI模型开发领域的最高水平。

  同时,模型还能原生调用Google搜索、执行程序代码,并支持用户自定义的第三方工具接入。

  开发者支持:多模态实时 API

  为帮助开发者构建更丰富的动态交互应用,Google同步推出了一款新的多模态实时API,支持实时音视频流输入和多工具组合调用。

  目前,开发者可通过Google AI Studio和Vertex AI平台使用2.0 Flash实验版的多模态输入和文本输出功能。而文本转语音和原生图像生成功能暂时仅向早期合作伙伴开放,预计将在明年1月实现更大范围的功能开放和模型版本更新。

  全球用户可用,新增研究利器Deep Research

  在用户端,2.0 Flash实验版已整合至Gemini聊天助手中,全球用户可以通过桌面和移动网页版的模型下拉菜单访问,移动应用集成也将于不久后推出。

  它专为复杂在线研究设计,能在用户提出问题后基于Gemini 1.5 Pro自动创建多步骤研究计划,收集和分析全网相关信息,并根据反馈不断优化,最终生成一份包含深入信息和准确来源的综合报告。大幅简化繁琐耗时的研究过程,堪称科研工作者福音,PhD狂喜。

  

  为“Agent 元年”打造的AI模型

  Gemini 2.0系列模型定位鲜明,直接就是“AI model for the agentic era” 。

  Pichai表示,过去一年Google一直专注于开发具备更强代理能力的模型,这类模型能深入理解用户所处环境,具备多步预判思维,并在监督下执行相应操作。结合此前发布的 Genie 2,Google 的空间智能和世界模型愿景已显露无疑。

  Project Astra:现实世界中的通用智能助手

  

  今年I/O大会上,Google首次展示了具备多模态理解能力、支持即时语音交互的Project Astra。得益于Gemini 2.0的加持和Android测试者的反馈,最新版本的Astra实现了以下关键升级:

  •对话能力全面提升:支持多语言及混合语言交流,能更准确理解不同口音和生僻词汇。

  •工具调用升级:原生集成Google搜索、Lens和地图功能,显著提升了在日常生活中的实用性。

  •记忆增强:能在对话中保持更丰富的上下文信息,支持长达10分钟的会话记忆,为用户带来更加个性化的交互体验。

  •延迟优化:通过新一代流媒体和音频理解技术,将响应速度提升至接近人类对话水平。

  Project Mariner:浏览器中的复杂任务助手

  

  Project Mariner是Google探索人机交互未来的实验性agent产品,专注于提升浏览器内复杂任务的处理能力。

  依托Gemini 2.0的先进推理能力,它能够全面理解和分析浏览器屏幕上的各类信息,包括像素数据、文本内容、代码片段、图片素材和表单元素等,并通过一个实验性的 Chrome 扩展来帮助用户完成任务。

  在衡量agent完成真实网页任务能力的WebVoyager基准测试中,Mariner作为单一agent系统取得了83.5%的领先成绩。

  不过,该项目在精确度和响应速度方面仍有提升空间。为确保使用安全,Mariner的操作权限被严格限制,对于在线购物等敏感操作必须经过用户确认,以此在安全性和效率间取得平衡。

  Jules:为开发者设计的 AI 编程助手

  Jules 是一款面向开发者的 AI 驱动代码agent,直接集成到 GitHub 工作流中。得益于 Gemini 2.0 的改进,Jules 可以在开发者的指导和监督下处理问题、制定计划并执行代码任务。这一项目旨在探索 AI agent如何在开发者社区中增强生产力,并为未来跨领域的 AI 应用铺平道路。

  游戏agent:打通虚拟与现实边界

  

  Google还分享了一些原型的隐藏彩蛋。

  例如在游戏领域, Gemini 2.0支持的智能agent展示了其在虚拟环境中的强大适应性。不仅能实时分析和推理屏幕动作,还能为玩家提供战略建议。

  此前DeepMind推出的Genie 2能从单张图像生成无限可玩的3D游戏世界,而与Supercell等开发商合作的游戏agent则在策略和模拟游戏中展示了出色的规则理解和问题解决能力。结合Google搜索功能,这些agent还能为玩家提供丰富的游戏知识支持。

  Gemini 2.0的空间智能潜力

  

  此外,Gemini 2.0在1.5版本的基础上,将空间理解能力提升到了新的高度。通过AI Studio推出的全新工具集,开发者可以更便捷地探索融合多模态推理的空间智能应用,这不仅体现在虚拟场景中,更可以延伸至机器人等物理世界应用领域。

  核心能力提升包括:

  • 快速空间分析:能以超低延迟识别和分析图像中物体的空间位置关系

  • 智能物体识别:支持图内搜索和匹配,即便是隐藏或模糊的细节也能准确找出

  • 多语言空间标注:结合空间信息实现智能多语言标注和翻译

  • 空间逻辑理解:掌握物体之间的空间关联,比如实物和对应的影子

  • 3D空间重建:首次将2D照片转换为可交互的3D俯视图

  在以上演示中,Gemini 2.0展现了多个令人印象深刻的应用场景:从识别折纸动物及其投影,到匹配特定图案的袜子,再到提供物品的双语标注,以及分析现实场景中的问题解决方案。尤其是新引入的3D空间理解功能,虽仍处于早期阶段,却已展现出将平面图像转化为立体可交互场景的潜力,为开发者开启了更广阔的应用想象空间。

  与OpenAI今天小打小闹的发布会相比,Google带来的Gemini 2.0不仅支棱起来,而且是凭实力稳稳赢了一局。

  Pichai表示,目前已有数百万开发者在使用Gemini构建项目,而Google自身也正借助Gemini重塑旗下七大核心产品,用户群体高达20亿。

    以上就是本篇文章【Gemini 2.0来了:一个要做所有AI agent底座的超级模型】的全部内容了,欢迎阅览 ! 文章地址:http://fabua.ksxb.net/news/4434.html 
     文章      相关文章      动态      同类文章      热门文章      栏目首页      网站地图      返回首页 海之东岸资讯移动站 http://fabua.ksxb.net/mobile/ , 查看更多   
最新文章
深耕AI赋能医疗!达州市中心医院自研微循环血管成像仪破解风湿免疫精准诊断难题
为积极响应国家推动医疗卫生事业高质量发展的战略部署,达州市中心医院锐意创新,持续加大科研攻关力度,成功研发出具有自主知识
平阴县岩棉板价格-防火岩棉板价格-抹墙岩棉板
此信息声明《厂家在河北廊坊市大城县》我们使用物流、快递配货发送过去。详细请垂询岩棉板是以玄武岩及其它天然矿石等为主要原料
红茶菌的功效和副作用喝茶更口渴
红茶菌的功效和副作用喝茶更口渴你有没有试过明明喝了一肚子红茶菌,嘴巴却像撒哈拉沙漠?这类“越喝越渴”的怪事,正在悄悄席卷
回收2005年人民大会堂茅台酒爆价一览一览
回收2005年茅台酒爆一览北京市:海淀区、东城区、西城区、宣武区、丰台区、朝阳区、崇文区、大兴区、石景山区、门头沟区、房山区
供应JQ80刚性联轴器夹壳联轴器,金属滑块联轴器
泊头市利永联轴器有限公司是专业从事联轴器及支架的研究、生产的企业。我公司实力雄厚,拥有一流的技术人员,先进的生产设备和完
问题:贷款纠纷,工伤认定和离婚中的借钱逾期两个星期怎么办?立即使用工伤认定意见书,物业费和法行怎么处理?
问题:贷款纠纷,工伤认定和离婚中的借钱逾期两个星期怎么办?立即使用工伤认定意见书,物业费和法行怎么处理?贷款纠纷首先别慌
全新质保三年瑞斯康达USFP-Gb/S1-D-R SFP千兆单模光模块15公里
深圳市狼之光技术有限公司是一家集生产、研发、销售为一体的有限责任公司。公司于2008年成立于深圳特区。在短时间内已发展成为国
九江去重庆个人游,3天2夜怎么玩才不踩坑?(避坑+攻略)
九江去重庆个人游,3天2夜怎么玩才不踩坑?(避坑+攻略)最近我一个人从九江坐高铁去了重庆,第一次去那座山城说实话起初有点紧
抚州去西安钟楼旅游, 2025必看省钱攻略 | 实测解析核心价值,3天2夜秘籍避坑曝光,省钱50%真像起底!
抚州去西安钟楼旅游, 2025必看省钱攻略 | 实测解析核心价值,3天2夜秘籍避坑曝光,省钱50%真像起底!嘿朋友。听说你要从抚州出发
呼和浩特市新城区工会职工说快板儿啦
“打竹板,响连天,咱把工会政策谈一谈……”,这清脆的竹板声和甜美声音,是从“新城区职工直播间”传出的。由新城区总工会职工