学习

幕布

幕布是一款AI驱动的大纲笔记工具,支持结构化知识整理与一键生成思维导图,帮助用户更高效地理解和记忆信息。其功能涵盖任务拆解、团队协作、多平台同步及Markdown编辑等,适用于学习、工作与会议管理等多种场景,提升信息处理效率与组织能力。

Voicemaker

Voicemaker,强大的文本到语音转换器,它也能通过先进的人工智能技术来制作高质量的画外音,听起来像人性化且富有表现力。

EliGen

EliGen是由浙江大学与阿里巴巴集团联合开发的实体级可控图像生成框架,采用区域注意力机制实现对图像中实体的精确控制,支持多实体修复、风格化生成及交互式编辑。基于50万高质量注释样本训练,具备强大泛化能力,适用于虚拟场景、角色设计、数据合成及产品展示等场景。

NMT

NMT是一种由UC Berkeley和阿里巴巴联合开发的多任务学习框架,通过将多任务优化问题转化为约束优化问题,实现高优先级任务性能的保障。它基于拉格朗日乘数法,结合梯度下降与上升算法,简化了超参数调整流程,提高了模型训练效率和稳定性。NMT适用于推荐系统、搜索引擎、自然语言处理和金融风控等多个领域,具有良好的兼容性和扩展性。

KAG

KAG是由蚂蚁集团开发的专业领域知识服务框架,通过知识增强技术提升大型语言模型在特定领域的问答性能。它结合知识图谱与向量检索,优化知识表示与推理过程,支持逻辑推理、多跳问答等功能,提升准确性和效率。适用于金融风控、医疗健康、智能客服、知识管理等多个场景,具备强大的语义理解和跨领域应用能力。

StoryBee

StoryBee是一款基于AI技术的儿童故事生成平台,能够根据用户提供的主题或关键词自动生成个性化故事,并支持互动式选择以提升参与感。平台提供多样化的故事情节,涵盖多种类型,并针对不同年龄段的孩子调整故事复杂度。StoryBee融合教育元素,同时具备家长控制功能,确保内容的安全与健康。此外,平台还提供多媒体支持及故事创作工具,助力家庭和学校教育。

Wispr Flow

Wispr Flow 是一款基于AI技术的语音转文字工具,支持100多种语言,具备自动编辑、上下文感知和低音量识别等功能,提升写作与沟通效率。提供免费基础版及付费专业版和团队版,适用于写作、商务、学习等多种场景,注重用户隐私保护,操作便捷自然。

Edicho

Edicho 是一种基于扩散模型的图像编辑工具,能够在多图像间实现一致性编辑,无需额外训练。其核心技术包括 Corr-Attention 注意力模块和 Corr-CFG 去噪策略,通过显式图像对应关系提升编辑质量与一致性。适用于图像修复、风格转换、内容创作、医学影像增强等场景,具备良好的兼容性与扩展性。

DAM

DAM-3B是英伟达开发的多模态大语言模型,专用于图像和视频中特定区域的详细描述。支持点、边界框、涂鸦或掩码等方式指定目标区域,生成精准文本描述。其核心技术包括焦点提示与局部视觉骨干网络,有效融合全局与局部特征。DAM-3B-Video版本扩展至视频处理,适用于动态场景。模型基于Transformer架构,支持多模态输入,广泛应用于内容创作、智能交互及无障碍工具等领域。

APB

APB是一种由清华大学等机构开发的分布式长上下文推理框架,通过稀疏注意力机制和序列并行推理提升大模型处理长文本的效率。采用更小的Anchor Block和Passing Block,结合查询感知的上下文压缩技术,减少计算开销并精准传递关键信息。在128K长度文本上,APB推理速度比Flash Attention快10倍,比Star Attention快1.6倍,适用于多种分布式环境和模型规模,广泛