AI
Pixel Reasoner
Pixel Reasoner是由多所高校联合开发的视觉语言模型,通过像素空间推理增强对视觉信息的理解和分析能力。它支持直接对图像和视频进行操作,如放大区域或选择帧,以捕捉细节。采用两阶段训练方法,结合指令调优和好奇心驱动的强化学习,提升视觉推理性能。在多个基准测试中表现优异,适用于视觉问答、视频理解等任务,广泛应用于科研、教育、工业质检和内容创作等领域。
Augment Agent
Augment Agent 是一款 AI 编程助手,支持 VS Code 和 JetBrains,具备强大上下文处理能力(最高 20 万 tokens),可自动学习用户编码风格并保持一致性。支持多模态输入、代码检查点、终端命令及跨平台协作,适用于复杂代码库开发和日常编程任务,性能在基准测试中表现优异。
