工具

autoMate

autoMate是一款基于AI与RPA技术的本地化自动化工具,用户可通过自然语言描述任务,无需编程即可完成复杂操作。支持本地部署,确保数据安全,兼容主流大模型,具备智能学习能力。适用于数据处理、报告生成、邮件自动化、跨平台流程管理及日常任务调度等场景,提升工作效率并释放创造力。

Gamma App

在线网页版创建演示文稿的工具

入梦AI变声器

入梦AI变声器提供了丰富的声音变化选项,从儿童的高亢声音到成年男性的低沉音调,用户可以根据自己的需求进行选择。

Upscale.Media

Upscale.Media,将您的图像放大到2倍或4倍而不失真,轻松增强低质量图像。

Continue

Continue是一款开源的AI代码助手,集成于VS Code和JetBrains系列IDE中,通过聊天功能和代码补全功能帮助开发者快速理解代码并完成编写。支持实时代码编辑、动作快捷方式以及自定义模型连接,旨在提高开发效率和代码质量。

FlowGram

FlowGram是字节跳动推出的可视化工作流搭建引擎,支持固定与自由布局,适用于流程管理、算法设计、教学演示等多种场景。具备智能建议、风险预测、文档生成等AI功能,支持导出图片或代码。技术上采用ECS架构、Web Worker优化与智能缓存,确保高效稳定运行,适合开发者进行流程构建与扩展。

MoMask

MoMask是一款基于生成式掩码建模的3D人体动作生成工具,支持文本驱动的动作创建与编辑。采用分层量化与Transformer架构,实现高精度、连贯的3D动作序列生成,在HumanML3D数据集上的FID值仅为0.045。支持动作时序控制、多平台部署及动作评估功能,适用于游戏开发、动画制作、VR及体育分析等多个领域。

S2V

S2V-01是MiniMax研发的视频生成模型,基于单图主体参考架构,可快速生成高质量视频。它能精准还原图像中的面部特征,保持角色一致性,并通过文本提示词灵活控制视频内容。支持720p、25fps高清输出,具备电影感镜头效果,适用于短视频、广告、游戏、教育等多种场景,具有高效、稳定和高自由度的特点。

Gemini Embedding

Gemini Embedding 是 Google 推出的文本嵌入模型,能将文本转化为高维向量以捕捉语义和上下文信息。支持超过 100 种语言,具备高效的检索、分类、聚类和相似性检测能力。其支持长文本输入和灵活的维度调整,适用于多场景应用,如智能搜索、数据分析和自然语言处理。模型基于 Gemini 训练,具有优秀的语言理解能力。

Ovis2

Ovis2是阿里巴巴国际团队开发的多模态大语言模型,采用结构化嵌入对齐技术提升视觉与文本的融合效果。支持视频、图像和多语言处理,强化了思维链推理和复杂场景下的OCR能力。提供多个参数规模的版本,适用于研究、开发及各类应用场景,展现卓越性能。