OpenGitHub社区:https://open.itc.cn/项目地址: https://github.com/OpenGithubs/Summary2024日飙升榜: https://github.com/OpenGithubs/github-daily-rank周飙升榜: https://github.com/OpenGithubs/github-weekly-rank月飙升榜: https://github.com/OpenGithubs/github-monthly-rank摘要:开源地址:https://github.com/facefusion/facefusion开源时间:2023-08-18⭐ 总星标数量:20.5k⭐上月增长数量:595⭐项目描述: 一个下一代换脸器和图像增强器。它使用先进的图像处理技术,允许用户将不同的面部特
项目(1): magic-research/magic-animate 字节开源视频驱动图片算法
开源地址:https://github.com/magic-research/magic-animate 开源时间:2023-11-21⭐ 总星标数量:10.6k⭐ 项目描述: 将静态图片驱动为动态图片,适合短视频场景项目(2): facefusion/facefusion 下一代换脸器和增强器
开源地址:https://github.com/facefusion/facefusion 开源时间:2023-08-18⭐ 总星标数量:20.5k⭐ 上月增长数量:595⭐ 项目描述: 一个下一代换脸器和图像增强器。它使用先进的图像处理技术,允许用户将不同的面部特征融合在一起,创造有趣和令人印象深刻的效果。这个项目的潜在应用包括娱乐、虚拟化妆和艺术创作,为用户提供了创造性的工具。项目(3): lllyasviel/Fooocus 图像生成软件
开源地址:https://github.com/lllyasviel/Fooocus 开源时间:2023-08-10⭐ 总星标数量:42.2k⭐ 上月增长数量:503⭐ 项目描述: 一个图像生成软件,基于Gradio开发。它不仅包含了内部优化和质量改进,还允许用户通过人机交互来探索和创造新的图像。Fooocus让用户不必担心复杂的技术参数,只需享受创造性的过程,拓展人类的想象力。这个项目适用于那些对图像生成和艺术创作感兴趣的人。项目(4): modelscope/facechain 深度学习工具链
开源地址:https://github.com/modelscope/facechain 开源时间:2023-08-10⭐ 总星标数量:9.2k⭐ 项目描述: facecchAIn是一个深度学习工具链,用于生成您的数字孪生项目(5): Tohrusky/Final2x 图像超分辨率工具
开源地址:https://github.com/Tohrusky/Final2x 开源时间:2023-06-19⭐ 总星标数量:6k⭐ 项目描述: 这是一个强大的工具,使用多个模型将图像超分辨率提高到任意大小,从而提高图像的分辨率和质量,使其更清晰和更详细。目前支持多个超分辨率模型,包括RealCUGAN、RealESRGAN、Waifu2x和SRMD。项目(6): SevaSk/ecoute 实时转录工具
开源地址:https://github.com/SevaSk/ecoute 开源时间:2023-05-08⭐ 总星标数量:5.9k⭐ 项目描述: Ecoute是一款实时转录工具,可以在文本框中为用户的麦克风输入和用户的扬声器输出提供实时转录。这意味着它可以记录您的言语并将其转化为文本,同时也能够捕捉扬声器的声音并进行实时文本转录。此外,Ecoute还整合了OpenAI的GPT-3.5,它不仅可以实时转录,还能够为用户生成基于对话的实时转录建议响应,提供了更加智能和响应性的功能。项目(7): SCUTlihaoyu/open-chat-video-editor 短视频自动生成工具
开源地址:https://github.com/SCUTlihaoyu/open-chat-video-editor 开源时间:2023-05-05⭐ 总星标数量:2.7k⭐ 项目描述: 开源短视频自动生成工具项目(8): openai/shap-e 3D对象生成
开源地址:https://github.com/openai/shap-e 开源时间:2023-04-20⭐ 总星标数量:11.7k⭐ 项目描述: 一个基于文本和图片生成3D对象的项目,它能够通过输入文本和图片,生成逼真的3D模型。这项技术为创作者提供了一种新的方式,让他们可以通过简单的输入,创造出复杂多样的3D对象。项目(9): z-x-yang/Segment-and-Track-Anything 对象跟踪和分割
开源地址:https://github.com/z-x-yang/Segment-and-Track-Anything 开源时间:2023-04-16⭐ 总星标数量:2.9k⭐ 项目描述: 该项目专注于分割和跟踪视频中的任何对象,利用自动和交互式方法。它使用了SAM(Segment Anything Models)和DeAOT等算法,实现了自动/交互式关键帧分割和高效多目标跟踪和传播。项目(10): gaomingqi/Track-Anything 交互式视频对象跟踪
开源地址:https://github.com/gaomingqi/Track-Anything 开源时间:2023-04-12⭐ 总星标数量:6.6k⭐ 项目描述: 该项目是一个灵活的交互式视频对象跟踪和分割工具,基于Segment Anything、XMem和E2FGVI等技术。它提供了方便的方式帮助用户在视频中追踪和分割感兴趣的对象,为视频分析和处理提供了实用的工具。项目(11): IDEA-Research/Grounded-Segment-Anything AI图像分割工具
开源地址:https://github.com/IDEA-Research/Grounded-Segment-Anything 开源时间:2023-04-06⭐ 总星标数量:15.5k⭐ 上月增长数量:206⭐ 项目描述: 这个项目结合了接地DINO(Deep Interpolation Network)与分段任何、稳定扩散、BLIP和耳语等技术,实现了自动检测、分段和生成具有图像、文本和语音输入的内容。它为用户提供了一种全面的内容处理工具,适用于多媒体数据的分析和生成。项目(12): VideoCrafter/VideoCrafter
开源地址:https://github.com/VideoCrafter/VideoCrafter 开源时间:2023-04-03⭐ 总星标数量:4.6k⭐ 项目描述: 一个用于制作视频内容的开源视频生成和编辑工具箱。项目(13): facebookresearch/segment-anything 自动对象分割工具
开源地址:https://github.com/facebookresearch/segment-anything 开源时间:2023-03-24⭐ 总星标数量:48.3k⭐ 项目描述: 分割一切的图像分割模型。它是来自 Meta AI 研究院的图像分割模型,只需一键就可以“切出”图像中的任何对象。它在 1100 万张图像和 11 亿个掩码(mask) 的数据集上完成了训练,能够在各种分割任务上具有很强的零样本(zero-shot) 性能。来自 @孤胆枪手 的分享项目(14): facebookresearch/AnimatedDrawings 创意动画工具
开源地址:https://github.com/facebookresearch/AnimatedDrawings 开源时间:2022-12-01⭐ 总星标数量:12k⭐ 上月增长数量:1331⭐ 项目描述: 这个创意动画工具使用对象检测模型、姿态估计模型和基于图像处理的分割方法,可以快速创建数字版的图画,并通过传统的计算机图形技术进行变形和制作成动画。项目(15): Winfredy/SadTalker 从音频生成面部运动系数的3D渲染工具
开源地址:https://github.com/Winfredy/SadTalker 开源时间:2022-11-23⭐ 总星标数量:12.1k⭐ 项目描述: 一个能够从音频中生成面部运动系数的工具,它利用了3DMM(三维形变模型)和一种新颖的3D感知面部渲染技术。该工具可以根据音频生成头部姿势和表情,用于说话的头部生成。SadTalker 提供了一种创新的方式来生成逼真的面部运动,为音频相关的应用提供了更丰富的表现手段。项目(16): ente-io/ente 相片加密
开源地址:https://github.com/ente-io/ente 开源时间:2022-11-01⭐ 总星标数量:16.9k⭐ 上月增长数量:570⭐ 项目描述: Fully open source, End to End Encrypted alternative to Google Photos and Apple Photos项目(17): OpenTalker/video-retalking 基于音频的说话视频同步工具
开源地址:https://github.com/OpenTalker/video-retalking 开源时间:2022-09-14⭐ 总星标数量:6.8k⭐ 项目描述: 一个基于音频的说话头视频同步编辑工具。它允许用户对视频进行编辑,以使视频的说话头与音频同步。这对于创建内容的人来说是一个有用的工具,尤其是在视频制作和编辑方面。video-retalking的开放源代码性质使其成为一个有潜力的多媒体工具。项目(18): brycedrennan/imaginAIry 人工智能图像编辑器
开源地址:https://github.com/brycedrennan/imaginAIry 开源时间:2022-09-12⭐ 总星标数量:8k⭐ 项目描述: 一个强大的人工智能图像编辑器,可以通过简单的命令来创建和转换图像,帮助用户实现创意的图像编辑。项目(19): upscayl/upscayl AI 图像升级器
开源地址:https://github.com/upscayl/upscayl 开源时间:2022-07-31⭐ 总星标数量:32k⭐ 上月增长数量:586⭐ 项目描述: 一款免费开源的 AI 图像升级器,使用先进的人工智能算法来放大和增强低分辨率图像,而不损失质量。该应用程序基于 Linux 优先理念,是一个跨平台应用程序,支持在所有主要桌面操作系统上使用。项目(20): WongKinYiu/yolov7 实时物体探测器
开源地址:https://github.com/WongKinYiu/yolov7 开源时间:2022-07-06⭐ 总星标数量:13.5k⭐ 项目描述: 这个项目提供了最新的技术,用于实时物体探测器。它是一个先进的工具,可以用于实时场景中的物体检测任务,具有高效准确的性能。项目(21): THUDM/CogVideo
开源地址:https://github.com/THUDM/CogVideo 开源时间:2022-05-29⭐ 总星标数量:9.9k⭐ 上月增长数量:497⭐ 项目描述: 一个可基于文本生成视频的开源项目:CogVideo,由清华大学数据挖掘研究小组开源,面向研究者和开发者的开源视频工具,支持视频摘要、语义理解、视频检索等功能,让您对视频有更深入的理解!项目(22): revanced/revanced-manager ReVanced的 Android应用程序
开源地址:https://github.com/revanced/revanced-manager 开源时间:2022-03-19⭐ 总星标数量:18.9k⭐ 上月增长数量:462⭐ 项目描述: Application to use ReVanced on Android项目(23): NVlabs/instant-ngp AI神经图形模型训练
开源地址:https://github.com/NVlabs/instant-ngp 开源时间:2022-01-06⭐ 总星标数量:16.1k⭐ 项目描述: 加速训练 NeRF 模型的项目。英伟达开源的最快只需 5 秒,训练出一只狐狸 NeRF 模型的技术。即根据静态的 2D 图片通过神经网络建模,快速训练出可以放大且从任何角度观察都清晰的图片.项目(24): Sanster/lama-cleaner 图像修复工具
开源地址:https://github.com/Sanster/lama-cleaner 开源时间:2021-11-15⭐ 总星标数量:20k⭐ 上月增长数量:399⭐ 项目描述: GitHub上一款开源的图像修复工具:LamaCleaner,基于SOTAAI模型构建,功能颇为齐全。可用于快速去除图像中各种物品、人物、字体、水印等对象,并支持老照片修复、文本替换图像内容等。项目(25): QianMo/Real-Time-Rendering-4th-Bibliography-Collection
开源地址:https://github.com/QianMo/Real-Time-Rendering-4th-Bibliography-Collection 开源时间:2021-10-02来源:Github推荐官一点号