agentkit-multimedia-shopping

Solid

基于ByteDance agentkit-samples多媒体用例的小省导购员数字人带货视频生成技能，整合多模态内容生成能力（图像、视频、音频），支持AI绘画、语音合成、视频生成，与小省导购员人设融合，9:16竖屏适配，直接对接带货视频生成流程

AI & Automation 4,328 stars 421 forks Updated today

Install

View on GitHub

Quality Score: 86/100

Stars 20%

100

Recency 20%

100

Frontmatter 20%

Documentation 15%

100

Issue Health 10%

License 10%

Description 5%

100

Skill Content

# AgentKit多媒体小省导购员数字人带货 ## 任务目标 - 本技能用于：基于ByteDance agentkit-samples多媒体用例，生成小省导购员数字人带货视频的多模态内容 - 能力包含： - AI绘画生成（小省导购员角色形象、场景背景） - 语音合成（导购员语音、背景音乐） - 视频生成（多模态组合） - 工作流编排（图像→音频→视频→成片） - 触发条件：用户需要生成小省导购员数字人带货视频，使用agentkit-samples的多媒体能力 ## 前置准备 ### 依赖说明本技能依赖以下Python包： ``` Pillow>=10.0.0 requests>=2.28.0 numpy>=1.24.0 ``` ### 环境准备 1. 安装agentkit-samples（如需要） 2. 准备API凭证（如涉及第三方服务调用） 3. 准备小省导购员角色固定特征描述 ### 前置知识 - 了解ByteDance agentkit-samples多媒体用例的基本功能 - 了解AI绘画、语音合成、视频生成的基本原理 - 了解9:16竖屏视频规格 ## 操作步骤 ### 标准流程 #### 1. 角色形象生成使用AI绘画生成小省导购员角色形象： **输入信息**： - 角色固定特征（脸型、发型、服饰、气质） - 场景类型（商务场景） - 情绪基调（热情、专业、亲切） **生成流程**： 1. 读取 [references/character-profile.md](references/character-profile.md)，获取小省导购员角色固定特征 2. 调用 [scripts/generate_character.py](scripts/generate_character.py) 生成角色形象 3. 裁剪为9:16比例，分辨率≥1080×1920 4. 保存参考图（供InfiniteTalk使用） **输出**：角色参考图（9:16竖屏） #### 2. 场景背景生成使用AI绘画生成场景背景： **输入信息**： - 场景类型（商务会议室、书房、洽谈室、大厅、办公室） - 情绪基调（冷调、暖调、中性） - 光影描述（侧光、顺光、顶光、逆光） **生成流程**： 1. 读取场景模板，选择对应场景类型 2. 调用 [scripts/generate_scene.py](scripts/generate_scene.py) 生成场景背景 3. 裁剪为9:16比例，分辨率≥1080×1920 4. 保存场景参考图 **输出**：场景参考图（9:16竖屏） #### 3. 语音合成使用TTS生成导购员语音： **输入信息**： - 话术内容（带货文案） - 语音类型（语速、语气） - 情绪基调（热情、专业、亲切） **生成流程**： 1. 准备话术内容（符合小省导购员人设） 2. 调用 [scripts/generate_voice.py](scripts/generate_voice.py) 合成语音 3. 导出为16kHz单声道wav格式 4. 保存语音文件（供InfiniteTalk使用） **输出**：语音文件（16kHz单声道wav） #### 4. 背景音乐生成使用音乐生成工具生成背景音乐： **输入信息**： - 情绪基调（热情、专业、紧迫、亲切） - 音乐风格（管弦乐、钢琴、弦乐） - 时长（5秒/幕） **生成流程**： 1. 根据情绪基调选择音乐...

Details

Author: anbeime
Repository: anbeime/skill
Created: 5 months ago
Last Updated: today
Language: Python
License: None

Similar Skills

Semantically similar based on skill content — not just same category

Code & Development Solid

infinitetalk-shopping-avatar

专为InfiniteTalk项目设计的小省导购员数字人带货提示词生成技能，基于四大智能体协同（提示词生成师、质量管控师、知识库运维师、跨环节适配师），生成适配Image-to-Video模式的结构化提示词（角色固定特征+动作时序+场景环境+音频匹配+光影氛围+技术约束），支持9:16竖屏、5s/幕、音频同步（Suno+chinese-wav2vec2-base）、一致性管控（角色/视觉/情绪），直接对接模型推理流程

4,328 Updated today

anbeime

Code & Development Solid

digital-avatar-shopping-video

小省导购员多智能体数字人口播带货视频生成系统，以"小省导购员"为核心人设，打造专业购物助手+数字人口播带货视频一体化服务。涵盖五大智能体（小省导购员、带货脚本师、数字人口播生成师、带货画面设计师、音画合成师），产出"数字人口播+带货画面+字幕音效"的成品视频，适配抖音、快手等短视频平台，支持淘宝、京东、拼多多、唯品会等全平台商品信息，具备知识库自动存取能力。

4,328 Updated today

anbeime

Code & Development Solid

product-video-creator

多智能体协同的商品视频创作流水线，支持从商品信息到成视频的全流程创作：文案生成、故事策划、脚本创作、分镜设计、图片生成、字幕创作、音效推荐及视频合成；适用于电商商品宣传、品牌推广、社交媒体营销等场景

4,328 Updated today

anbeime