来源:互联网 | 时间:2024-05-16 13:04:42
GPT4V大模型的各种能力非常出色且全面,不仅拥有静态分析能力,在动态分析方便也是相当优秀,经过测试人员的详细评测,表现十分惊人,下面小编带来相关内容介绍,感兴趣的朋友们来看一看吧。
GPT4V大模型的各种能力非常出色且全面,不仅拥有静态分析能力,在动态分析方便也是相当优秀,经过测试人员的详细评测,表现十分惊人,下面小编带来相关内容介绍,感兴趣的朋友们来看一看吧。
1.除了静态内容,GPT-4V还能做动态分析,不过不是直接喂给模型一段视频。
2.上面的五张图是从一段制作寿司的教程视频中截取的,GPT-4V的任务是(在理解内容的基础上)推测这些图片出现的顺序。
3.而针对同一系列的图片,可能会有不同的理解方式,这是GPT-4V会结合文本提示进行判断。
4.比如下面的一组图中,人的动作究竟是开门还是关门,会导致排序结果截然相反。
5.当然,通过多张图片中人物状态的变化,还可以推测出他们正在做的事情。
6.甚至是预测接下来会发生什么: