工具

MobA

MobA是一种基于多模态大型语言模型的移动智能体,通过高级全局智能体(GA)和低级局部智能体(LA)的两级架构,实现任务规划、分解与执行,支持跨应用操作和自动化流程。其反思模块助力高效处理复杂任务,广泛应用于个人助理、智能家居控制、移动设备自动化及教育等领域。

AIMv2

AIMv2是苹果公司开发的开源多模态自回归预训练视觉模型,通过图像与文本的深度融合提升视觉理解能力。其采用图像块与子词标记拼接的方式进行自回归预训练,支持多种参数规模,适用于不同设备。具备视觉问答、指代表达理解、图像字幕生成、多媒体检索等功能,并可无缝集成到大型语言模型中。模型在多个视觉任务中表现优异,具备良好的可扩展性和零样本适应能力。

Umi

Umi-OCR 是一款离线 OCR 工具,支持图片、截图和 PDF 文档的文字识别,具备数学公式与二维码识别功能,可生成可搜索 PDF。支持多语言识别与界面切换,提供命令行和 HTTP 接口调用,适用于文档数字化、数据录入、教育等多个场景。

LanPaint

LanPaint 是一款基于 Stable Diffusion 的高质量图像修复工具,无需额外训练即可实现精准修复。通过多轮迭代推理优化修复效果,支持多种参数调整,适用于图像修复、内容替换及艺术创作等多种场景,操作简便且效果自然。

iA Presenter

iA Presenter 的文本界面将焦点放在故事上,节省时间和精力。

Imagine Me

Imagine Me是一个在线平台,用户只需输入文字描述就可以为自己创造出人工智能艺术。通过该平台,用户可以上传10-20张不同的高质量照片,创建自己的个人模型。

k1.5

k1.5 是月之暗面推出的多模态思考模型,具备强大的数学、代码、视觉推理能力。在 short-CoT 模式下,性能超越主流模型 550%,在 long-CoT 模式下达到 OpenAI o1 水平。支持文本与图像的联合处理,适用于复杂推理、跨模态分析、教育、科研等领域。通过长上下文扩展和策略优化,提升推理效率与准确性。

FaceAiSwap

AI 换脸,一款允许用户与名人、朋友或其他任何人交换面孔。这用户友好的工具使用先进的人工智能技术将您的脸部无缝集成到任何图像中,提供了一种有趣且富有创意的方式,让您在不同的场景中重新想象自己。

Relevance AI

Relevance AI 是一款无代码 AI 平台,支持企业快速构建和管理智能代理,实现自动化工作流程。平台兼容多种大语言模型,具备高安全性与强集成能力,适用于销售、客服、数据分析等多领域应用,助力提升运营效率与数据处理能力。

Animaker AI

Animaker AI是一个在线视频制作平台,可以帮助初学者、专业人士和其他所有人在几分钟内创建动画和真人视频。