用GPT-4V“操纵”iPhone,无需训练可完成任意指令,“Siri终结的开始”GPT-4V,就是Siri终结的开始。一项研究发现:无需任何训练,GPT-4V就能直接像人类一样与智...
用GPT-4V“操纵”iPhone,无需训练可完成任意指令,“Siri终结的开始”
GPT-4V,就是Siri终结的开始。
一项研究发现:
无需任何训练,GPT-4V就能直接像人类一样与智能手机进行交互,完成各种指定命令。
比如让它在50-100美元的预算内购买一个打奶泡的工具。
它就能像下面这样一步一步地完成选择购物程序(亚马逊)并打开、点击搜索栏输入“奶泡器”、找到筛选功能选择预算区间、点击商品并完成下单这一系列共计9个操作。
根据测试,GPT-4V在iPhone上完成类似任务的成功率可达75%。
因此,有人感叹有了它,Siri渐渐就没有用武之地了(比Siri更懂iPhone)
谁知有人直接摆摆手:
Siri压根儿一开始就没这么强好嘛。(狗头)
还有人看完直呼:
智能语音交互时代已经开始。我们的手机可能要变成一个纯粹的显示设备了。
真的这么?
GPT-4V零样本操作iPhone
这项研究来自加州大学圣地亚哥分校、微软等机构。
它本身是开发了一个MM-Navigator,也就是一种基于GPT-4V的agent,用于开展智能手机用户界面的导航任务 网页链接
版权声明: 发表于 2023-11-16 8:12:05。
转载请注明:用GPT-4V“操纵”iPhone,无需训练可完成任意指令,“Siri终结的开始”GPT-4V,就是Siri终结的开始。一项研究发现:无需任何训练,GPT-4V就能直接像人类一样与智... | AI 時.空 | AiTime.Space
转载请注明:用GPT-4V“操纵”iPhone,无需训练可完成任意指令,“Siri终结的开始”GPT-4V,就是Siri终结的开始。一项研究发现:无需任何训练,GPT-4V就能直接像人类一样与智... | AI 時.空 | AiTime.Space
暂无评论...