首页
首页
WenGe
帅气的我简直无法用语言描述!
文章
1
网址
2657
书籍
0
软件
1
评论
0
已发布
2657
ScreenAgent
一个先进的计算机控制智能体,它通过观察屏幕截图和执行鼠标键盘动作来完成复杂的任务。它利用VLM和强化学习环境,可以在真实计算机屏幕上执行多步骤任务。
1,698
143
AI开源项目
# AI开源项目
# ScreenAgent
# VLM
OpenCodeInterpreter
通过结合大型语言模型和代码执行反馈,提供了一个强大的工具,可以帮助开发者在软件开发过程中提高效率和质量。
1,821
475
AI开源项目
# AI开源项目
# 交互式代码开发
# 人工智能编程辅助
ChatMusician
通过结合先进的大型语言模型和音乐表示法,为音乐的理解和生成提供了一个强大的工具。它不仅能够创作音乐,还能理解和回答音乐理论问题,为音乐教育和创作提供了新的可能性。
1,254
315
AI开源项目
# AI开源项目
# 和弦生成
# 多模态交互
StarCoder 2
一个强大的代码生成和理解工具,它通过大规模训练和多样化的模型规模,为开发者提供了一个高性能的编程辅助平台。
1,207
101
AI开源项目
# AI开源项目
# AI编程
# 代码理解
Snap Video
强大的文本到视频合成工具,它通过创新的技术架构和高效的深度学习模型,实现了高质量视频内容的生成。这款工具不仅在视频生成领域具有突破性,还为用户提供了一种全新的创作和表...
1,643
280
AI开源项目
# AI开源项目
# AI视频合成
# Transformer架构
TextDiffuser-2
一个功能强大的图像生成工具,它通过扩散模型技术,根据文本描述生成高质量的图像。这个工具为用户提供了一种创新的方式来探索和实现他们的创意视觉概念。
1,626
470
AI开源项目
# AI图像生成
# AI开源项目
# 内容创造
UniEdit
UniEdit 是一个强大的视频编辑工具,它通过利用预训练的文本到视频生成器,在无需调优的情况下,提供了一种简单而有效的方法来编辑视频的运动和外观。
1,194
124
AI开源项目
# AI开源项目
# 文本驱动编辑
# 无需调优
OmniGen
创新的统一图像生成模型,它通过简化架构和整合多种图像生成任务,为用户提供了一个强大而灵活的工具。它不仅能够处理文本到图像的生成,还能够执行图像编辑、主题驱动生成和视觉...
1,430
451
AI开源项目
# AI开源项目
# 多任务图像处理框架
# 多模态输入支持
I2VGen-XL:阿里推出的图生视频模型
一个强大的图像到视频的生成模型,它通过创新的方法解决了AI视频合成过程中的语义准确性、清晰度和时空连续性的挑战。用户可以轻松地将静态图像转换为高质量的动态视频,生成的视...
1,777
333
AI开源项目
# AI开源项目
# 图像到视频生成
# 开源模型
美图奇想大模型
提升了视频和图像的生成质量,广泛应用于影像美化、视频剪辑、电商设计、口播视频制作、广告营销和游戏设计等多个领域
832
363
AI开源项目
# AI开源项目
# AI视觉模型
# 图像生成
SeedEdit
一款功能强大且创新的图像编辑工具,它通过先进的扩散模型技术,实现了对图像的高精度和高审美的编辑
1,305
334
AI开源项目
# AI开源项目
SUPIR
一款功能强大且多用途的图像恢复工具,它通过结合AI技术和文本驱动的智能恢复,能够为用户提供高保真度的图像恢复服务
1,494
206
AI开源项目
# AI开源项目
加载更多
网址
网址
文章
软件
书籍