新用户登入 登录

萌子岛

  • 4
  • 0

xAI将升级Grok为多模态AI模型 可处理图像输入扩展应用范畴

1023粉丝
darthracer Elysion~楽的次元2024-7-5 08:56 显示全部楼层 |阅读模式
<
1.jpg

在多家开发AI的企业之中,Elon Musk的xAI算是比较特别的一个,主力产品Grok拥有社交平台X上的内容作为辅助数据,也加入罕有的“有趣模式”可以开玩笑。最近他们更在开发者文件中表示,即将升级模型到多模态版本,支持图像输入。

xAI在4月已经预告将会推出Grok-1.5V模型,为目前的Grok聊天机器人加入多媒体处理能力,据称新版本将会可以处理多种视频资讯,包括文件、图表、屏幕截屏和照片等等。他们更声称新版本在多个基准测试中都相当接近甚至超越目前其他竞争对手,例如GPT-4、Claude 3和Gemini Pro 1.5。

2.jpg

而在最新公开的开发者文件中,xAI更提供了Python脚本范例,展示了开发者如何使用xAI的软件开发工具包(SDK)库来生成基于文本和图像的回应。该脚本可以读取图像,设置文本提示,并利用xAI SDK产生回应。Grok-1.5V到底在实际应用上能否业界顶级标准仍然有待观察,不过相信不用等很久就可以知道了。
您需要登录后才可以回帖 登录 | 新用户登入

小黑屋|萌子岛

GMT+8, 2025-2-6 18:00 , Processed in 0.524863 second(s), 30 queries , Gzip On, MemCache On.

Copyright 2020  atollmoe©.a2.1.0 All rights reserved. 9+

Copyright 2009  supported by zhixuan© oeo© oko© All rights reserved.Thank you!

快速回复 返回顶部 返回列表