谷歌一雪前耻PaLM 2反超GPT-4办公全家桶升级Bard超

本站原创 2023-11-08 21:48:34

　　编辑：编辑部

　　【新智元导读】新版PaLM 2超强进化，办公全家桶Workspace全面升级，Bard全面增强、所有人可用……可以看出，这届I/O大会，谷歌是真的憋出不少大招。

　　谷歌I/O 2023大会，仿佛又给谷歌的支持者们打了一针强心剂。

　　对打GPT-4的PaLM 2登台、Duet AI整进谷歌办公全家桶Workspace、Bard超强进化向所有人开放、谷歌搜索加入AI快照、AI新功能整合进Android 14、AI魔术编辑器加入谷歌相册等等。

　　这届I/O大会，可谓眼花缭乱，精彩纷呈。

　　PALM 2秀肌肉，手机也能跑

　　OpenAI的GPT-4，已经被全世界公认为最强大的语言模型。

　　怎么对打GPT-4？谷歌的答案，就是PaLM 2。

　　恰在今天，谷歌一同发布了PaLM 2技术报告。

　　据谷歌高级研究主管Slav Petrov介绍，PaLM 2在推理、编码和翻译上都表现更好，与2022年4月发布的第一代PaLM相比，PaLM 2有了明显的改进。

　　可以看到，PaLM 2的推理能力，得到了显著的改进

　　修改代码bug后，用韩语评论。

　　德语「Ich verstehe nur Bahnhof」如果直译，就是「我只理解火车站」，但如果你问它，你是不是理解错误了？

　　它马上就会告诉你，没错，这个德语的意思是「你说的啥？我什么都听不懂」。

　　此前，谷歌一直被嘲在AI研究上已经落后于微软，PaLM 2，无疑是谷歌的一次重大回击。

　　但PaLM 2同样也面临着一些争议，比如训练语言模型的数据是否合法？

　　谷歌只是提到训练语料库来自「网络文档、书籍、代码、数学和对话数据」，但并没有进一步的细节。

　　而大语言模型的幻觉问题，同样无法避免。谷歌研究副总裁Zoubin Ghahramani表示，PaLM 2是对早期模型的改进，谷歌「投入了大量精力，不断改进基础性和归因指标」。

　　但他承认，在打击AI产生的虚假信息方面，大家都还有很长的路要走。

　　除了PALM 2，谷歌还宣布了正在训练的全新基础模型Gemini。这是第一个多模态模型，同样包含了参数大小不同的模型。

　　除了介绍模型，谷歌还特地介绍了开发 AI 技术的社会责任感，包括两个判别AI生成内容的工具：

　　- watermarking（嵌入水印）

　　- metadata（嵌入元数据）

　　想做一个遛狗业务的收费表？描述一下，它就给你自动生成。

　　目前，谷歌正在使Bard变得更加可视化，让Bard能够分析图像，并且能在查询结果中提供图像信息等等。

　　关于这一方面，谷歌在发布会上展示了一个案例。

　　假如用户问Bard，美国的新奥尔良有哪些必看的景点，那么Bard就能图文并茂的解答这个问题。

　　就像用户在谷歌搜图中问同样的问题一样。

　　而另一个更好玩儿的功能是用图像提示系统。该功能由Google Lens提供，它能够识别图片中的物体。

　　比方说，上传一张狗狗的照片，然后给一个prompt「为这两只狗写编一个有趣的标题」。Google Lens就可以识别狗狗的品种，然后Bard就能写下与这两只狗狗特征相关的内容。

　　只要选中代码，就可以一键导出到Colab或者Replit。

　　还支持20 种编程语言。基本涵盖了码农们所需的所有编程需要。

　　劈柴在发布会一开始就整了个小活。航班取消了得退款？不会写申请退款的邮件？

　　gmail会。

　　Magic Editor是谷歌最新公布的照片处理功能，使用生成性AI，可以让用户在没有专业工具的情况下对照片进行各种编辑。

　　不会p图星人的福音来了？

　　发布会上，谷歌分享了几个应用了这项新功能的案例，不得不说，效果酷炸了。

　　比如下面这张，Magic Editor一键把瀑布前的人像挪到了侧面，还把背景中别的游客p掉了。不仅如此，本来多云的天气硬是给p蓝了。

　　再比如下面这张，Magic Editor一键将长凳上的小孩连着凳子一起移到了中间，自动补齐了多出来的椅子，还把原画中缺失的气球补齐了。

　　而且天也p蓝了。

　　当然，这项功能还没到最完美的地步。就比方说，仔细看看上面这张图片，凳子挪动了，可是底下的影子没动。

　　但总归，这项功能对照片本身的理解是性的。

　　当然，咱现在还不用太担心是不是有的图片被Magic Editor处理过。因为谷歌说了，下半年才会推出这项功能。

　　AI笔记本Project Tailwind

　　学生党福音来了。

　　不得不说，谷歌还真把学生们拿捏住了。

　　Project Tailwind从本质上讲，就是个笔记本，但是加了AI的能力。

　　一下子就不一样了。

　　用户可以像问导师或者学习搭子一样进行在Tailwind里进行检索。

　　虽说谷歌把这个功能其定位为学生服务的工具，但是对于日常需要处理大量文本的打工人来说，也是重大利好。

　　隐藏在Tailwind背后的理念是，为什么我们不能为每个用户定制不同的AI语言模型呢？

　　当然，这里存在两个问题。

　　一方面是成本问题。训练语言模型所需的计算需求和微调成本都很高，谁来负担这个成本？另一方面则是信息安全性。

　　毕竟，捏造信息这种事可一点都不稀奇，谁能保证个性化的笔记本不会出现同样的问题呢。

　　不过，是骡子是马还得拉出来遛遛。用户目前可以注册Project Tailwind进行测试。该功能也是AI Labs计划的一部分。

　　安卓开发小助手

　　此外，谷歌I/O大会上还推出了专为Android开发的AI编码机器人Studio Bot。

　　不仅可以生成代码、修复BUG，甚至能够回答关于安卓应用开发的相关问题。

　　同时支持Kotlin和Java编程语言，并将直接嵌入到Android Studio开发工具的工具栏中。

智库数据近三年国家科技三大奖数据分析

89 2023-11-20

GPT-4强到离谱首席科学家开源并不明智我们之前错

103 2023-11-20

西安电子科技大学大妈们警觉机器人ChatGPT要来夺

199 2023-11-14