不过比起这则关于AI的消息,上面两条明显有趣得多,分别是OpenAI已经在用GPT4去解释GPT2的回复逻辑,以及谷歌一夜之间甩出各种王炸全家桶。
来看看OpenAI这条,现在谈到目前大火的语言类AI的时候,有个问题是,不知道它的行为模式是怎么样的,会怎么回复,对于AI的输出,全靠模型的“自觉”与使用者的对AI沟通的掌握程度,但就算设定了参数也会出现与其之外的问题。
就连开发出模型的OpenAI都说不理解这其中的黑箱关系。而大家目前还喜欢用“涌现”一词来描述这种突然获得的——看上去比较智能的行为,而这种所谓智能的特性对于监管者来说,代表它是不受控制的,说话没有边界,很容易造成管理上的麻烦。
除了智能的回答,还有AI幻觉与“说谎”的问题,而为了理解数百亿或数千亿个参数的神经网络,靠人力有些勉强了,于是OpenAI就用最新的AI模型去让它猜测“以前的自己”会做出什么样的行为,然后对其行为作出解释。
而不是说让模型去解释为啥会生成这样的东西,这是两个不同的问题,官方也提到了这个的局限,要想理解AI为啥会产生某种行为,目前还是没有办法。做GPT4理解GPT2的研究,是为了让其他研究人员更好的上手GPT2,就相当于是抓了两只奇怪的猴子,一个聪明点的猴子帮助人类制作了一把更趁手的,用于研究解剖另一只猴子的手术刀。
动静这么大,作为同样是巨无霸,还是以搜索引擎为傲的谷歌,能咽下这口气?
让一个以前不那么看得上的对手,在自己眼前搔首弄姿,这不得白眼翻到天上去,于是谷歌在5月10号的Google I/O 2023年度开发者大会,也发布了自己多款AI产品。
有对标OpenAI的全新PaLM 2模型、新的支持多模态的Gemini模型,还有专门对标微软办公套件Copilot的Duet AI、以及对标微软NewBing,支持多模态的Gemini智能模型——没错,谷歌这是“发飙”,就是在1打2。
甚至对一些第三方工具也是无差别的“饱和打击”,推出了自己的AI作图工具 Magic Editor、“AI笔记本”项目Tailwind、谷歌地图加入3D沉浸式路线视图,还有在谷歌邮件里面集成的“帮你写”功能,可以对邮件进行修改和扩写。
除了软件还有自己的硬件发布,新的Pixel Fold,计划中的智能手表Wear OS 4等,以及公开官宣的 26000 个 Nvidia H100 Hopper GPU 的 AI 超级计算机A3(老黄笑麻系列),总的来说,这就是谷歌的年度动作大剧“狂 飙”。
根据介绍,PaLM2能用20多种编程语言和100多种口头语言,还有一个轻量化的Gecko版本可以在移动设备上运行,PaLM2有四个版本,从小到大分别为Gecko、Otter、Bison、Unicorn。
而在自家的20多种产品上,已经在测试和使用这个新模型,而对于普通用户可以感知最明显的地方,则是把这个工具放进了AI聊天机器人Bard里面,简单来说,就是对话更精准了,编程能力更强了。
而且Bard和新必应一样,取消了等待名单,开启了类似无名单限制的“公测”模式,支持聊天记录导出,可供180个国家地区的用户使用,目前仅支持英语外的日语和韩语,后续才会逐步支持40种语言。
“这些货你这车能拉吗?”“能拉!只能拉一点点...”
而之所以大家都在说AI的概念,是因为在未来回首今天,新的大型AI公司会在这几年出现,后续追随者将很难达到前者的体量,现在是巨头布局的时候,大家现在可能还没有太多的感觉,觉得AI不过如此,做的事情有限,但是从软件型的AI转向硬件互动型的时候,那时候再动作就慢了。
而现在国内不允许国外的AI产品进来,也是一种布局与机会,固然局面不是看文章的你我所能决定的,倒不如期望国内的大厂少些尔虞我诈,尽快跟上步伐。同时随着量子计算机等技术的发展,在2035年左右的发展节点,对密码学也是一大冲击,听说有些国际机构现在专门截取了很多信息(像是医药或者发展规划等信息依旧有价值),在等量子计算机发展成熟后解密。
而AI技术的发展,无疑会加快信息时代的演变。处于时代洪流,对于科技的变化值得期待,而这些科技大厂互相折腾的过程可能不太雅,但是只要存续下去,就会成为未来某些赞歌里赞美“顽强”的一部分吧。
参考资料:
OpenAI-语言模型可以解释语言模型中的神经元
谷歌官网-2023 Google I/O 大会
新智元-谷歌一雪前耻,全新PaLM 2反超GPT-4,办公全家桶炸裂升级,Bard史诗进化
半导体行业观察-谷歌推拥有26000个H100的超算 加速AI军备竞赛
IT之家-谷歌相关新闻