模型

Star

Star-3 Alpha是一款基于F.1架构的图像生成大模型,擅长处理复杂提示词,生成高质量、真实感强的图像。具备出色的美学捕捉能力和丰富的参数调节选项,适用于艺术创作、广告设计、电商展示等多种场景,极大提升了相关行业的设计效率与成果质量。

MetaStone

MetaStone-L1-7B 是一款轻量级推理模型,具备强大的数学和代码推理能力,性能达到行业领先水平。基于 DeepSeek-R1-Distill-Qwen-7B 架构,采用 GRPO 训练方式,支持多种计算架构并具备高效的云原生部署能力。适用于数学解题、编程辅助、智能客服、内容创作等多个场景,具有广泛的应用价值。

AutoDroid

AutoDroid-V2是由清华大学人工智能产业研究院开发的基于小型语言模型(SLM)的移动端GUI自动化工具,支持多步脚本生成与执行,提升任务完成效率并减少对云端模型的依赖。其核心功能包括自动化UI操作、代码生成与执行、应用文档生成,适用于日常辅助、办公、测试、智能家居及医疗等多个场景,具有较高的实用性和技术前瞻性。

探迹SalesGPT

探迹SalesGPT通过其大数据和AI技术,为企业提供全方位的智能销售解决方案,帮助企业实现销售流程的数字化转型,提升销售效率和业绩。

Piece it Together

Piece it Together 是一款基于AI的图像生成工具,能够将零散的视觉元素整合成完整概念图像,并智能补全缺失部分。依托IP+空间和IP-Prior模型,支持语义编辑与文本控制,提升图像生成的准确性和多样性。适用于角色设计、产品开发、艺术创作等多个领域,助力创意探索与设计验证。

Megrez

Megrez-3B-Omni是一款具备全模态理解能力的开源模型,支持图像、音频和文本的综合处理,具备强大的推理效率和多模态交互功能。它能够在多个权威测试集中展现卓越性能,尤其擅长场景理解、OCR识别及语言生成等任务,同时通过智能WebSearch调用增强问题解答能力,适用于个人助理、智能家居、车载系统等多种应用场景。

Fashion

Fashion-VDM是一款由谷歌和华盛顿大学合作研发的虚拟试穿技术,利用视频扩散模型生成人物穿着指定服装的高质量试穿视频,具有高保真度、时间一致性及强大的服装细节还原能力。它结合了扩散模型架构、分割分类器自由引导与渐进式时间训练策略,并在图像与视频数据联合训练的基础上实现了高效稳定的视频生成过程。

NodeTool

NodeTool是一款开源的AI工作流可视化构建工具,通过图形化界面和无代码开发环境,用户可以便捷地集成并运行多种AI模型。它支持本地GPU运行、云服务扩展以及多模态数据处理,适用于图像生成、音乐创作、音频转视觉艺术等多个领域,为非技术用户提供高效且灵活的AI解决方案。 ---

OpenELM

OpenELM是苹果公司推出的一系列高效开源语言模型,涵盖从2.7亿到30亿参数规模的不同版本。该模型基于Transformer架构,采用层间缩放策略优化参数分配,使用分组查询注意力(GQA)和SwiGLU激活函数等技术。OpenELM在公共数据集上预训练,并在多项自然语言处理任务中展现出色性能。模型代码和预训练权重已公开,旨在促进开放研究和社区发展。