模型

Phygital+

Phygital+ 是一个基于AI提供了多种功能和工具整合的平台,允许用户使用AI并创建、转换和增强图像、视频和 3D 模型。

HuggingSnap

HuggingSnap 是一款基于 Hugging Face 的 AI 助手应用,采用轻量级多模态模型 SmolVLM2,支持图像、视频和文本的本地处理与生成。具备即时视觉描述、多语言文字识别与翻译、隐私保护等功能,适用于旅行、日常辅助、医疗及零售等场景,确保用户数据安全。

olmOCR

olmOCR 是一款开源 PDF 文档处理工具,结合文档锚定技术和 Qwen2-VL-7B-Instruct 模型,可高效提取结构化文本并保留原始布局。支持多种文档类型,具备大规模批量处理能力和低成本优势,适用于学术研究、法律文件处理、企业文档管理及数字图书馆建设等多个场景。其开源特性与可扩展性也增强了用户的使用灵活性。

讯飞医疗大模型

讯飞医疗大模型致力于通过人工智能技术赋能医疗行业,提供包括智能导诊、医疗影像分析、医疗大数据分析等在内的医疗健康解决方案。

Visily AI

Visily AI,面向非设计师的革命性 AI 驱动的线框工具。

芝士饼

一款支持一站式AI原生应用的开发平台,芝士饼无需任何代码基础,只需通过自然语言,简单几步即可完成应用的创建与发布。

Gendo

Gendo是一款结合生成式AI技术的建筑可视化平台,通过生成对抗网络(GANs)和扩散模型等手段,帮助设计师快速创建逼真的建筑概念图,并支持从草图到最终图像的全周期操作,具备生成性编辑、风格迁移和文本到图像生成等功能,旨在提升设计效率与视觉沟通质量。

ScriptViz

ScriptViz是一款基于MovieNet数据库的剧本可视化工具,利用CLIP模型实现剧本文本与电影画面的匹配,支持用户通过SQL语句设定剧本属性并生成视觉化参考。其功能涵盖视觉素材检索、剧本与视觉匹配、故事分析及对话对齐可视化,旨在提升剧本创作过程中的视觉表现力和叙事连贯性。此外,ScriptViz还提供情绪捕捉、场景细化及角色开发等应用,适用于剧本开发、故事板制作等多个场景。

DreamOmni

DreamOmni是一款由香港中文大学、字节跳动与香港科技大学联合研发的统一图像生成与编辑模型。它集成了文本到图像生成(T2I)及多种编辑功能,包括指令式编辑、修复、拖拽编辑和参考图像生成。DreamOmni利用合成数据管道高效生成高质量编辑数据,并通过联合训练提升图像生成与编辑质量。该模型在多任务处理、复杂提示兼容性及训练效率优化上表现优异,适用于数字艺术、影视特效、广告设计等多个领域。

PersonaCraft

PersonaCraft是一种结合扩散模型和3D人体建模的全身图像合成技术,能够从单一参考图像生成多个逼真的个性化全身图像。它支持遮挡处理、用户自定义身体形状,并通过3D感知姿态条件控制提高生成图像的质量。该工具广泛应用于社交媒体、广告、时尚、游戏及电影等领域,为个性化定制提供了强大的技术支持。