AI工具

DisPose

DisPose是一项由多家顶尖高校联合研发的技术,专注于优化人物图像动画的质量。它通过运动场引导和关键点对应的方式,结合混合ControlNet模块,实现了对骨骼姿态的有效控制,无需额外密集输入即可生成高质量、一致性的动画视频。DisPose广泛适用于艺术创作、社交媒体、数字人制作及虚拟现实等领域。

VideoGrain

VideoGrain是由悉尼科技大学与浙江大学联合研发的零样本多粒度视频编辑框架,支持类别级、实例级和部件级的精细化视频修改。它通过调节时空交叉注意力和自注意力机制,提升文本提示对目标区域的控制能力,确保时间一致性与特征分离,显著优于现有T2I和T2V方法。该工具无需额外参数调整,具备高效计算性能,适用于影视制作、广告营销、内容创作等多个领域。

汉语新解

汉语新解是一款利用AI技术重新诠释汉语词汇的工具,提供深度解读、创意文本生成、SVG卡片设计等功能,支持风格定制与多场景应用,旨在推动语言创新与文化传承。

Stable Artisan

Stable Artisan是一款基于Discord平台的图像和视频生成机器人服务,利用Stability AI的AI技术和模型,如Stable Diffusion 3和Stable Video Diffusion,使用户能够通过自然语言提示生成高质量的图像和视频。此外,它还提供了一系列图像编辑工具,包括搜索替换、背景去除、高清放大、扩展外延、控制素描和结构等功能,适用于创意人士、设计师、内容创作

Leffa

Leffa是一种基于注意力机制的可控人物图像生成框架,通过流场学习精确控制人物的外观和姿势。其核心技术包括正则化损失函数、空间一致性及模型无关性,能够在保持细节的同时提升图像质量。Leffa广泛应用于虚拟试穿、增强现实、游戏开发及影视后期制作等领域,展现出卓越的性能与灵活性。

ChatExcel Pro

ChatExcel Pro是一款基于AI技术的表格处理与数据分析工具,支持多种文件格式的导入与多表上传,具备强大的Excel函数操作能力及多表分析功能。用户可通过自然语言指令实现复杂数据处理,支持一键生成分析报告和表格下载,适用于多种应用场景,如财务会计、市场营销、人力资源管理和库存管理等。

Pixel Reasoner

Pixel Reasoner是由多所高校联合开发的视觉语言模型,通过像素空间推理增强对视觉信息的理解和分析能力。它支持直接对图像和视频进行操作,如放大区域或选择帧,以捕捉细节。采用两阶段训练方法,结合指令调优和好奇心驱动的强化学习,提升视觉推理性能。在多个基准测试中表现优异,适用于视觉问答、视频理解等任务,广泛应用于科研、教育、工业质检和内容创作等领域。

吐槽大师

“吐槽大师”是一款由Monica开发的AI工具,它能够通过分析用户的社交媒体账号来生成个性化且具有幽默感的吐槽内容。该工具主要支持Instagram、Twitter和LinkedIn三个平台,能够自动读取并分析用户的社交媒体内容,捕捉个性特征和风格,并生成独特的幽默吐槽。用户可以保存或分享生成的内容,以增加互动乐趣。

StarVector

StarVector 是一个开源多模态视觉语言模型,支持图像和文本到可编辑 SVG 文件的转换。采用多模态架构,结合图像编码与语言模型,生成结构紧凑、语义丰富的 SVG 内容。基于 SVG-Stack 数据集训练,适用于图标设计、艺术创作、数据可视化等多种场景,具备良好的性能和扩展性。

AI问客

AI问客是一个多功能的AI助手,它能够覆盖广泛的使用场景,为用户提供智能问答和内容创作服务。