工具

olmOCR

olmOCR 是一款开源 PDF 文档处理工具,结合文档锚定技术和 Qwen2-VL-7B-Instruct 模型,可高效提取结构化文本并保留原始布局。支持多种文档类型,具备大规模批量处理能力和低成本优势,适用于学术研究、法律文件处理、企业文档管理及数字图书馆建设等多个场景。其开源特性与可扩展性也增强了用户的使用灵活性。

MemeCam.ai

一个在几秒钟内用你的照片创建超级有趣的表情包AI工具。

XCole

XCole是一款集成了AI绘图、文本生成、翻译与代码辅助的多功能AI创作平台。它支持从图像生成到文本创作的多样化需求,并提供专业场景模板以满足不同领域的创作需求。XCole凭借其友好的用户界面和强大的功能,帮助用户提升工作效率,广泛应用于学术研究、内容创作、设计开发等多个场景。

派照星

晒娃就用派照星,不需要去相馆,轻松生成写真。海量模版,模版随意挑选,轻松组合。发挥孩子想象力,进入童话世界。

豆包视觉理解模型

豆包视觉理解模型是一款集视觉识别、理解推理和复杂逻辑计算于一体的先进AI工具。它具备强大的视觉定位能力,支持多目标、小目标和3D定位,并能识别物体的类别、形状、纹理等属性,理解物体间的关系和场景含义。此外,模型在视频理解方面表现出色,能够进行记忆、总结、速度感知和长视频分析。凭借其高效性和成本优势,该模型广泛应用于图片问答、医疗影像分析、教育科研、电商零售及内容审核等领域。

Mureka V6

Mureka V6是昆仑万维推出的AI音乐创作平台基座模型,支持多语言音乐生成及纯音乐创作。采用自研ICL技术,提升音乐结构连贯性与情感表达。用户可通过文本、音频或音色参考进行个性化创作,适用于多种音乐风格与情绪。支持从简单模式到高级模式的灵活操作,广泛应用于音乐爱好者、专业音乐人及内容创作等领域。

Gemma 3 QAT

Gemma 3 QAT 是谷歌推出的开源 AI 模型,采用量化感知训练技术,在降低显存需求的同时保持高性能。它支持多模态任务,具备 128,000-token 长上下文处理能力,并可在消费级 GPU 和边缘设备上运行。适用于视觉问答、文档分析、长文本生成等场景,同时兼容多种推理框架,便于部署。

Palettemaker

一款面向创意专业人士和色彩爱好者的独特工具,可让您在来自最常见创意领域(例如徽标设计、UI/UX、图案、海报等)的设计中创建调色板。

SOM AI

SOM AI 是一款 AI 辅助学术写作工具,帮助学生完成毕业论文和学术研究。它提供研究主题头脑风暴、段落释义、简化复杂内容等功能,帮助学生避免抄袭并快速理解学术内容。SOM AI 还能提供情感支持,缓解写作压力,适用于毕业论文和日常学术作业,是高效的学习助手。

BFS

BFS-Prover 是一种基于大语言模型的自动定理证明系统,通过改进广度优先搜索算法和长度归一化评分机制,提高证明搜索效率。系统结合专家迭代、直接偏好优化和分布式架构,支持复杂定理的高效验证,并与 Lean4 深度集成,确保形式化数学问题的逻辑正确性。适用于数学竞赛题、本科及研究生数学研究等领域,推动了自动定理证明技术的发展。