语言模型
Pixel Reasoner
Pixel Reasoner是由多所高校联合开发的视觉语言模型,通过像素空间推理增强对视觉信息的理解和分析能力。它支持直接对图像和视频进行操作,如放大区域或选择帧,以捕捉细节。采用两阶段训练方法,结合指令调优和好奇心驱动的强化学习,提升视觉推理性能。在多个基准测试中表现优异,适用于视觉问答、视频理解等任务,广泛应用于科研、教育、工业质检和内容创作等领域。
TinyTroupe
TinyTroupe是一款基于大型语言模型的Python库,专注于生成逼真的虚拟人物行为。它通过构建虚拟角色(TinyPerson)与环境(TinyWorld),实现个性化、高自由度的行为模拟,并支持多智能体间的互动。该工具适用于市场研究、产品测试、用户体验优化等多个领域,为企业提供洞察力与决策支持。
---
AutoConsis
AutoConsis是一款基于深度学习和大型语言模型的UI内容一致性智能检测工具,能够自动识别和提取界面中的关键数据,并对数据一致性进行高效校验。它支持多业务场景适配,具备高泛化性和高置信度,广泛应用于电商、金融、旅游等多个领域,助力提升用户体验和系统可靠性。
AI Interview Copilot
AI Interview Copilot是一款专为求职者设计的AI辅助工具,通过实时语音转录和先进的语言模型(如GPT-4)来提升远程面试的表现。主要功能包括实时转录、问题解答、算法问题解决和图像识别等。该工具支持多语言,帮助求职者在技术或编程面试中快速生成答案和代码,从而更加自信地展示专业技能,提高面试成功率。
