米老鼠SD模型上线
【AiBase提要:】新融资将主要用于扩大Robin AI在美国和亚太地区的业务。这标志着公司在全球范围内推动其AI法律合同解决方案的全球化战略。淡马锡控股有限公司作为新一轮融资的领头投资者,显示了投资者对Robin AI技术和商业前景的强烈信心。
VCoder作为一个视觉编码器,为MLLM提供了更好的视觉感知能力,能够处理特殊类型的图像,并改善了对象感知任务的表现。在与其他模型的比较中,VCoder在对象计数和识别方面表现出色,特别是在复杂场景中。
LLaVA是一个端到端训练的多模态大模型,它将视觉编码器和用于通用视觉和语言理解的Vicuna相结合,具备令人印象深刻的聊天能力。而CogAgent是在CogVLM基础上改进的开源视觉语言模型,拥有110亿个视觉参数和70亿个语言参数。