You need to enable JavaScript to run this app.
导航

數位分身資料錄製要求

最近更新時間2023.08.11 14:21:02

首次發佈時間2023.08.11 14:21:02

客製化數位分身需要拍攝一段4~5分鐘真人出鏡的口播表演視頻,經AI訓練後就可以得到您的數位分身形象!

拍攝要求

拍攝前,了解整體配置設定

要求描述
拍攝內容1條訓練影片。影片需要一鏡到底,不可以有任何剪輯!
影片時長4~5分鐘

硬體需求

資料格式

  • 若為實景,請提交實景mp4文件

  • 若需要火山引擎側進行摳圖,請提交原始綠幕/藍幕背景的mp4文件

  • 若您已自行完成摳圖,請提交帶有alpha通道的mov文件

解析度要求1080p:垂直螢幕:1080x1920;橫屏:1920 × 1080
幀率要求25fps
碼率要求20000Kbps以上
編碼要求H.264
穩定性要求攝影機和全片影像無抖動跳躍、無縮放;色彩無跳躍;聲畫同步;不支援HDR!
光圈要求以F5.6為​​基準進行調節,確保正確曝光與景深範圍

畫面要求

背景要求

  • 若後續需更換人物背景,請以綠幕/藍幕為背景拍攝,確保布幕鋪滿整個拍攝畫面

  • 若後續無需更換人物背景,可使用實景拍攝

拍攝要求

  • 相機焦點聚焦於目標形象臉部,同時確保人物身體清晰

  • 拍攝期間機位、服裝、光線始終保持一致,不能發生變化或抖動等

  • 整個畫面保持水平,人物眼神平視鏡頭;仰拍/俯拍人物可能會變形,建議盡量避免

人物要求

拍攝要求

  • 人物全身光線充足

  • 人物動作請勿遮擋面頸部,人物嘴部及嘴唇在口播時請全程完整出現在畫面內

  • 綠幕/藍幕背景下:

    • 人物離綠幕稍遠防止綠幕浸染,建議與綠幕維持2公尺以上的距離

    • 人物身上避免穿戴與背景相同顏色的衣物和飾品,服裝與拍攝背景有明顯的顏色區分

    • 防止穿著或擺放有透明度/亮面/易反光的衣物及道具,否則易透出/反光背景的顏色,不利於後續更換背景

  • 目前介面不支援美顏,若需要美顏請自行處理後再提交資料;請參考本文「拍攝後」部分

畫面佈局及演員姿態

請依最終產生效果的期望畫面分佈進行錄製,參考版面與姿態如下:

站姿-全身-居中

站姿-半身-居中

坐姿-半身-居中

拍攝中,遵守訓練影片表演要求

提交的訓練影片會作為成品影片的動作模版,同時訓練數位人口型。
成品影片僅替換此影片的口型,其餘的表情、動作均還原此視頻,請按期望的畫面進行道具和光線佈置、按期望​​的使用場景進行人物口播與表演。

錄製內容

同一條影片中:

  1. 人物進行20秒閉嘴,不露齒

20秒內需保持背景安靜(自然底噪),不能出現導演指揮等人聲或其他噪音!

  1. 進行4~5分鐘的口播與動作表演

表演開始和結束都需要在一個相對靜止的姿勢上停頓各兩秒

文字要求

  • 請自備5分鐘與使用場景適配的自然文本

  • 請勿數數字或念誦重複率高的內容,否則會影響口型效果

收音要求

  • 錄音需收音,朗讀時請保持背景環境安靜

  • 不允許出現明顯底噪、人聲重疊(如導演指揮聲音與口播聲音重合)等影響語音收音的情況;否則需在環境恢復安靜後重新開始錄製

朗讀要求

  • 吐字發音清晰,嘴巴飽滿,盡量避免抿嘴、舔唇等其他唇形多餘動作

  • 建議事先熟悉文本,確保表達流暢;若讀錯也無礙,請繼續保持表演的狀態

頭部面部要求

  • 人物保持**正面朝前;**若有左右搖頭,**側臉角度不得超過45度;**若有低頭或抬頭,上下角度不得超過30度

  • 嘴部及嘴唇在口播時需要全程出現在畫面內,下半張臉和頸部不產生任何遮擋(麥克風也不能擋臉和脖子)

  • 說話期間建議保持自然頭動和表情,以達到自然的敘述感和交流感

  • 頭部動作請勿與語意強相關,如出現表肯定的點頭、否定的搖頭;否則會與合成的文字內容不適配、有違和感

動作要求

  • 可做出中性的自然敘述的手部動作,注意人物動作請勿遮擋下半張臉和頸部

  • 動作無明顯指向性,如比數字、按讚豎大拇指、揮手等;否則會與合成的文本內容不適配、有違和感

  • 人物整體盡量不出畫面,包括衣服和動作

拍攝範例

暫時無法在飛文書文檔外展示此內容
直播場景範例
暫時無法在飛文書文檔外展示此內容
播報場景範例


拍攝後,可選進行後製

若需要美顏(美白、磨皮、瘦臉、調色),可自行處理後再提交資料。

美顏原則

美顏效果不能使人物的頭部面產生任何扭曲或變形!

具體參數參考:

推薦軟體

若只進行人物美化,推薦使用剪映
若您需要自行摳圖,請使用較專業的軟體進行摳圖;以下只介紹自行摳圖場景下的美化建議

美化步驟

美化部位集中在臉部,主要是美白,磨皮和臉部瘦臉這3處:

  • 美白可調高,但需注意可能會影響其他裸露膚色

  • 磨皮不建議開大,否則會模糊臉部細節

  • 瘦臉需依人物臉型調整,多數人物的下顎骨收縮後較美觀

其他參數可依不同人物的情況自行微整
基本上所有有專門美顏功能的軟體都能夠自動辨識臉部,臉部以外的其餘畫面一般不會受到影響,可避免人物扭曲形變問題

匯出影片

解析度:1080p
碼率:20480Kbps以上
編碼:H.264
格式:mp4
幀率:25fps

如何提高客製化成功率?

以下為提高客製化成功率的建議事項,拍攝中請依實際情況進行調整:

注意項錯誤參考正確參考

打光

光線充足

  • 畫面較暗

  • 亮度合適

人物

動作勿遮擋面頸部

  • 動作遮擋面頸

  • 動作通用,幅度合適

妝髮服裝整潔

  • 碎發凌亂不美觀

  • 髮型整潔美觀

飾品勿隨意晃動

  • 耳環晃動

  • 固定耳環


訓練完成,以人聲驅動數位人

若需以人聲音訊驅動數位人,則需要額外提供一段錄音音訊。錄音內容為最終產生的影片的內容。

  • 環境需求:請在安靜的環境下進行錄製,如會議室,底噪盡量控制在-65dB以下

  • 其他要求:盡量保證朗讀時不出現磕巴和讀錯等情況,整段錄音可以直接使用

  • 時長要求:盡量控制在5分鐘內

  • 格式要求:24k,單聲道,wav(不做強制要求,盡量滿足即可)


附PPT版本說明:數位分身拍攝需求v2-0510.pptx