用GPT-4V“操纵”iPhone,无需训练可完成任意指令,“Siri终结的开始”GPT-4V,就是Siri终结的开始。一项研究发现:无需任何训练,GPT-4V就能直接像人类一样与智...

贴文 3周前
570 0

用GPT-4V“操纵”iPhone,无需训练可完成任意指令,“Siri终结的开始”

GPT-4V,就是Siri终结的开始。

一项研究发现:

无需任何训练,GPT-4V就能直接像人类一样与智能手机进行交互,完成各种指定命令。

比如让它在50-100美元的预算内购买一个打奶泡的工具

它就能像下面这样一步一步地完成选择购物程序(亚马逊)并打开、点击搜索栏输入“奶泡器”、找到筛选功能选择预算区间、点击商品并完成下单这一系列共计9个操作。

根据测试,GPT-4V在iPhone上完成类似任务的成功率可达75%。

因此,有人感叹有了它,Siri渐渐就没有用武之地了(比Siri更懂iPhone)

谁知有人直接摆摆手:

Siri压根儿一开始就没这么强好嘛。(狗头)

还有人看完直呼:

智能语音交互时代已经开始。我们的手机可能要变成一个纯粹的显示设备了。

真的这么?

GPT-4V零样本操作iPhone
这项研究来自加州大学圣地亚哥分校、微软等机构。

它本身是开发了一个MM-Navigator,也就是一种基于GPT-4V的agent,用于开展智能手机用户界面的导航任务 网页链接

暂无评论

暂无评论...