agentkit-multimedia-shopping

Solid

基于ByteDance agentkit-samples多媒体用例的小省导购员数字人带货视频生成技能,整合多模态内容生成能力(图像、视频、音频),支持AI绘画、语音合成、视频生成,与小省导购员人设融合,9:16竖屏适配,直接对接带货视频生成流程

AI & Automation 1,525 stars 170 forks Updated today

Install

View on GitHub

Quality Score: 86/100

Stars 20%
100
Recency 20%
100
Frontmatter 20%
70
Documentation 15%
100
Issue Health 10%
50
License 10%
0
Description 5%
100

Skill Content

# AgentKit多媒体小省导购员数字人带货 ## 任务目标 - 本技能用于:基于ByteDance agentkit-samples多媒体用例,生成小省导购员数字人带货视频的多模态内容 - 能力包含: - AI绘画生成(小省导购员角色形象、场景背景) - 语音合成(导购员语音、背景音乐) - 视频生成(多模态组合) - 工作流编排(图像→音频→视频→成片) - 触发条件:用户需要生成小省导购员数字人带货视频,使用agentkit-samples的多媒体能力 ## 前置准备 ### 依赖说明 本技能依赖以下Python包: ``` Pillow>=10.0.0 requests>=2.28.0 numpy>=1.24.0 ``` ### 环境准备 1. 安装agentkit-samples(如需要) 2. 准备API凭证(如涉及第三方服务调用) 3. 准备小省导购员角色固定特征描述 ### 前置知识 - 了解ByteDance agentkit-samples多媒体用例的基本功能 - 了解AI绘画、语音合成、视频生成的基本原理 - 了解9:16竖屏视频规格 ## 操作步骤 ### 标准流程 #### 1. 角色形象生成 使用AI绘画生成小省导购员角色形象: **输入信息**: - 角色固定特征(脸型、发型、服饰、气质) - 场景类型(商务场景) - 情绪基调(热情、专业、亲切) **生成流程**: 1. 读取 [references/character-profile.md](references/character-profile.md),获取小省导购员角色固定特征 2. 调用 [scripts/generate_character.py](scripts/generate_character.py) 生成角色形象 3. 裁剪为9:16比例,分辨率≥1080×1920 4. 保存参考图(供InfiniteTalk使用) **输出**:角色参考图(9:16竖屏) #### 2. 场景背景生成 使用AI绘画生成场景背景: **输入信息**: - 场景类型(商务会议室、书房、洽谈室、大厅、办公室) - 情绪基调(冷调、暖调、中性) - 光影描述(侧光、顺光、顶光、逆光) **生成流程**: 1. 读取场景模板,选择对应场景类型 2. 调用 [scripts/generate_scene.py](scripts/generate_scene.py) 生成场景背景 3. 裁剪为9:16比例,分辨率≥1080×1920 4. 保存场景参考图 **输出**:场景参考图(9:16竖屏) #### 3. 语音合成 使用TTS生成导购员语音: **输入信息**: - 话术内容(带货文案) - 语音类型(语速、语气) - 情绪基调(热情、专业、亲切) **生成流程**: 1. 准备话术内容(符合小省导购员人设) 2. 调用 [scripts/generate_voice.py](scripts/generate_voice.py) 合成语音 3. 导出为16kHz单声道wav格式 4. 保存语音文件(供InfiniteTalk使用) **输出**:语音文件(16kHz单声道wav) #### 4. 背景音乐生成 使用音乐生成工具生成背景音乐: **输入信息**: - 情绪基调(热情、专业、紧迫、亲切) - 音乐风格(管弦乐、钢琴、弦乐) - 时长(5秒/幕) **生成流程**: 1. 根据情绪基调选择音乐...

Details

Author
anbeime
Repository
anbeime/skill
Created
4 months ago
Last Updated
today
Language
Python
License
None

Similar Skills

Semantically similar based on skill content — not just same category

Code & Development Listed

digital-avatar-shopping-video

小省导购员多智能体数字人口播带货视频生成系统,以"小省导购员"为核心人设,打造专业购物助手+数字人口播带货视频一体化服务。涵盖五大智能体(小省导购员、带货脚本师、数字人口播生成师、带货画面设计师、音画合成师),产出"数字人口播+带货画面+字幕音效"的成品视频,适配抖音、快手等短视频平台,支持淘宝、京东、拼多多、唯品会等全平台商品信息,具备知识库自动存取能力。

1,525 Updated today
anbeime
Code & Development Listed

infinitetalk-shopping-avatar

专为InfiniteTalk项目设计的小省导购员数字人带货提示词生成技能,基于四大智能体协同(提示词生成师、质量管控师、知识库运维师、跨环节适配师),生成适配Image-to-Video模式的结构化提示词(角色固定特征+动作时序+场景环境+音频匹配+光影氛围+技术约束),支持9:16竖屏、5s/幕、音频同步(Suno+chinese-wav2vec2-base)、一致性管控(角色/视觉/情绪),直接对接模型推理流程

1,525 Updated today
anbeime
Code & Development Solid

product-video-creator

多智能体协同的商品视频创作流水线,支持从商品信息到成视频的全流程创作:文案生成、故事策划、脚本创作、分镜设计、图片生成、字幕创作、音效推荐及视频合成;适用于电商商品宣传、品牌推广、社交媒体营销等场景

1,525 Updated today
anbeime