AI工具

Vision Search Assistant

Vision Search Assistant (VSA) 是一种结合视觉语言模型与网络代理的框架,旨在提升模型对未知视觉内容的理解能力。它通过网络检索,使 VLMs 能够处理和回答有关未见图像的问题。VSA 在开放集和封闭集问答测试中表现出色,支持图像描述生成、网络知识搜索、协作生成等功能,可应用于图像识别、新闻分析、教育、电商和旅游等多个领域。

MM

MM-StoryAgent是由上海交通大学X-LANCE实验室与阿里巴巴集团联合开发的开源多模态、多智能体框架,用于生成沉浸式有声故事绘本视频。它结合大型语言模型与多模态生成技术,通过多阶段写作流程和模态对齐优化,提升故事内容的质量与连贯性。支持灵活模块化设计,适用于儿童教育、数字内容创作、在线教育等多个场景,为故事创作提供高效、可定制的解决方案。

MagicTailor

MagicTailor 是一款基于 DM-Deg 和 DS-Bal 技术的新型 AI 工具,支持组件可控的个性化图像生成。它能够动态干扰不需要的视觉语义,平衡概念与组件的学习,从而显著提升生成图像的质量和控制精度。MagicTailor 的核心功能包括组件可控个性化、动态掩码退化、双流平衡、解耦生成及多组件控制,适用于广告、游戏、电影制作等多个领域。

KTransformers

KTransformers是一款由清华大学KVCache.AI团队与趋境科技联合开发的开源工具,用于提升大语言模型的推理性能并降低硬件门槛。它支持在24GB显卡上运行671B参数模型,利用MoE架构和异构计算策略实现高效推理,预处理速度达286 tokens/s,推理速度达14 tokens/s。项目提供灵活的模板框架,兼容多种模型,并通过量化和优化技术减少存储需求,适合个人、企业及研究场景使用。

SNOOPI

SNOOPI是一种基于增强单步扩散模型的文本到图像生成框架,通过PG-SB和NASA技术提高了模型的稳定性和控制力。它在多方面表现出色,包括提高生成效率、排除不期望的图像元素、支持多种模型背板以及生成高质量图像。SNOOPI广泛应用于数字艺术、游戏开发、广告、社交媒体和影视等领域。

GeneralDyG

GeneralDyG是一种由南洋理工大学提出的通用动态图异常检测方法,适用于社交网络、电商、网络安全和金融等领域。该工具通过时间 ego-graph 采样、图神经网络和时间感知 Transformer 模块,有效捕捉动态图的多尺度特征,具备高适应性和计算效率。实验证明其性能优于多种主流方法,具有广泛的应用前景。

HouseCrafter

HouseCrafter是一款基于2D扩散模型的AI工具,可将平面图自动转换为高质量的3D室内场景。它具备多视图图像生成、全局一致性保障及用户交互编辑等功能,广泛应用于建筑设计、室内设计、房地产营销等领域,有效提升了虚拟环境创建的效率与准确性。

StealthGPT

StealthGPT是一款生成“不可检测”AI文本的工具,主要面向学生和内容创作者。它通过“人类化”处理,使AI生成的内容更接近人类写作,从而绕过AI检测工具。支持多语言写作、自动化引用、格式化、图片转答案、SEO写作以及PDF辅助阅读等功能。用户可选择不同版本以满足学习、创作和商业需求。

腾讯混元Turbo S

腾讯混元Turbo S是腾讯推出的高效AI模型,采用Hybrid-Mamba-Transformer架构,提升推理效率并降低计算成本。支持快速响应、多领域推理、内容创作及多模态生成,适用于对话、代码、逻辑推理等场景。兼具短思维链与长思维链能力,性能对标行业领先模型。

Hostinger

Hostinger是一款创新的在线AI网站构建工具,通过人工智能技术简化了网站创建过程。该平台提供拖放编辑器及多种AI工具,如内容撰写、图像生成、SEO优化和博客创作,以增强网站功能。此外,它还支持电子商务功能,如产品展示和支付系统集成,并承诺网站适应移动设备,确保良好的用户体验。 ---