腾讯云腾讯混元大模型新功能：腾讯发布hunyuan-vision实现图片多模态处理

73阅读

0评论

0点赞

腾讯发布混元大模型系列新成员hunyuan-vision，具备图片基础识别、内容创作、多轮对话、知识问答、分析推理及OCR等功能。

腾讯混元大模型系列迎来新成员——hunyuan-vision。该模型集成了多项前沿技术，能够在对话过程中处理图片输入，并生成相应的文本描述。

主要功能包括：

图片基础识别：准确识别图片中的物体与场景。
图片内容创作：基于图片生成创意性描述或故事。
图片多轮对话：支持连续的图片与文本交互对话。
图片知识问答：针对图片内容提供知识性问答服务。
图片分析推理：对图片进行深度分析并得出逻辑结论。
OCR（光学字符识别）：从图片中提取文字信息。

更多详细信息，请访问 API概览。

暂无评论，期待您的发言...

发表评论

阿狸Tom

这家伙很懒，什么也没写~

文章

动态

加入时间