Intel RealSense D435i 3D麵部和動（dòng）作捕捉功能介紹-北（běi）京91影视免费版下载（dá）偉業科技（jì）有限公司

Intel RealSense D435i 3D麵部和動作捕捉功（gōng）能（néng）介紹

2019/11/11 點擊：

Intel RealSense D435i(實（shí）感技術)概覽，本文對Intel RealSense D435i 3D麵部和動（dòng）作捕捉功能做簡（jiǎn）要（yào）介紹

前段時間CES的報道滿（mǎn）天飛，網上逛了幾圈（quān），感覺料猛的還數Intel：老樹開新花，推出14nm的第五代酷睿處理器；在智能可（kě）穿戴設備及物聯網上雄起；RealSense實感技術開啟（qǐ）未來人機交互模（mó）式。之前總聽老哥（gē）講，鼠標（biāo）鍵盤這些傳統交互模式統（tǒng）治了二三十年，目前跟蹤識（shí）別爆火且技術趨於（yú）成熟，新的交互革命（mìng）快要打響了。看RealSense這陣勢，估計不（bú）出三五年新的交（jiāo）互便會（huì）普及開來。

英特爾早在2012年左右就著重研發實感（gǎn）技術，當時叫Perceptual Computing，即（jí）感（gǎn）知計算，並開放英特爾® 感知計算軟件開發套件 2013 版（Intel® Perceptual Computing Software Development Kit, SDK 2013），設重獎（jiǎng）舉辦因特爾感知計算挑戰賽（sài），吸引（yǐn）眾多開發者參與。隨著技術完善與成熟，2014年初更名為RealSense，即實感技（jì）術，而後發（fā）布了新（xīn）的Intel® RealSense™ SDK 2014 ，同時舉行（háng）2014英特爾®RealSense™應用挑戰賽。

基於（yú）此技術的應用在IDF2014及今年CES上大放異彩。

Intel® RealSense™ SDK的架構：SDK core,I/O module和Capability modules組成整個（gè）SDK堆棧的基（jī）礎。SDK core管（guǎn）理I/O module和Capability modules同時組織並管理管線的執行。I/O module捕獲（huò）設備的輸入數據而後發送數（shù）據到（dào）輸出（chū）設備或（huò）Capability modules。Capability modules也叫algorithm modules，主要（yào）包括各種模式檢測和識別算法（麵部跟蹤和檢測、手部跟蹤、手勢識別、語音識別及合成等）。

各功能：手部和（hé）手指跟蹤、麵部分析、語音識別、背景（jǐng）移除、目標跟（gēn）蹤（zōng）、增強現實、3D掃描（miáo）。

1. 手

SDK將手抽象出骨架，並從背景中剝離出來。允許在（zài）照相機的0.2–1.2米範圍內跟蹤手上的22個（gè）點的位置和方（fāng）向，如圖。左右手是區分的，因而可以雙手進行交互。

手勢識（shí）別：包括（kuò）靜態手勢識別（bié）和動態手勢識別。SDK中內嵌了一係列手勢如（rú）下圖。你可以用內嵌的這些手勢組合出新的手勢，也可以根（gēn）據手骨架上那22個點位置創建出（chū）新的手勢。

動態手勢識（shí）別：靜態手（shǒu）勢可以單獨（dú）使用（yòng），當然（rán）也可以組合使用形成一定（dìng）的動作。組合時要求開始（shǐ）的手勢和結束（shù）的手勢都已在手（shǒu）勢識別係統中注冊。

SDK給出了一係列動作如下：

2．臉

臉部檢測：SDK提供準確的（de）3D臉部檢測和跟蹤，且可以同時跟（gēn）蹤4張人臉。每張人臉用長方形來標（biāo）記，你可以獲得長方形的XYZ坐標（biāo）。與2D跟（gēn）蹤相比，3D頭部跟蹤在頭部運動方麵更給力。

臉部識別：SDK提供識別特定人臉（liǎn）的能力。特定ID對應注冊的特定人臉，並將此（cǐ）人臉的信息存儲到人臉庫（kù）的內存中。如果同張人臉被注冊多次，那這（zhè）張人臉被正確識別的機會將會增大。當沒被（bèi）識別的（de）人臉出現（xiàn）時，識（shí）別模（mó）塊將與數據庫中的可能（néng）數據進行比對，如果找到匹配（pèi）則返回此人臉對應的ID。

用戶不用擔心（xīn）自己（jǐ）的頭像被存（cún）儲，因為存儲的隻（zhī）是算法從圖像中提取的特征的集合。

頭的運動（dòng）：SDK提供頭部運（yùn）動的3D方向：俯仰、左右（yòu）轉動（dòng）、左右偏轉（zhuǎn），如圖。

所（suǒ）以可以輕鬆（sōng）獲得用戶頭部指向哪裏。也可以以此做粗略的眼神跟蹤，下一版將會推出更精細的眼（yǎn）神（shén）跟蹤。

標（biāo）記點跟蹤：SDK提供（gòng）臉部（bù）78個標（biāo）記點（diǎn）的跟蹤以（yǐ）提高臉（liǎn）部識別（bié）和分析的準確度。在圖像和坐標係中給出（chū）這（zhè）78個標記點的位置。臉部標記點跟蹤支持頭像創建、臉部動畫、擬態及簡（jiǎn）單的表情識別。可以直接用這些點或這些點的相（xiàng）對位置來作分析。不管你有沒有劉海、戴不戴眼鏡，這種標（biāo）記點跟蹤都支持。但用戶頭（tóu）部在屏（píng）幕30度內效果*好。

麵部表情識別：SDK也包括更高級的麵部表情識別。這使得（dé）你創建卡通頭像更（gèng）簡單。每一種表（biǎo）情有1到100的強度等級使（shǐ）得你做的動畫更平滑自然（rán）。SDK中表情：

情感識別：SDK中的情感識別算法用的是2D RGB數據。情感模塊是獨立的模塊，並非臉部（bù）模塊的一部分（fèn）。為保障情感識別（bié）正常工作，圖像中的人臉至少要有48×48個像（xiàng）素。此算法並不局限於RGB數（shù）據（jù），灰度數據同樣（yàng）可行。利用SDK，你可以檢測並估計（jì）以下六種原始情感的強度。

頭像控製：SDK通過結合麵部表情及78個標記點提供簡單的頭像控製（zhì）功能。SDK提供動畫角色的示例代碼，使你的應用可（kě）以適應任何臉型並把用戶頭像動畫化。

應用場景：

3. 語音

主要包括語音命令（lìng）和控製（zhì）、聽（tīng）寫、從文字轉（zhuǎn）譯成語音等功（gōng）能。隻支持英（yīng）語（yǔ），語音識別對成年人效（xiào）果*好。

語音（yīn）識別：分為命令模式和聽寫模式。命令（lìng）模式需提前（qián）設定命（mìng）令列表，特定命令綁定特定動作。聽寫模式內置了一個通用的詞典，包括50k個常用（yòng）單詞。如果你覺得不夠用（yòng），也可以自己添加詞典中沒有的單詞。聽寫模式限時30秒。命令和（hé）聽寫（xiě）模式不可同時開啟。

語音分析：SDK也可以根據文（wén）本動態的生成語音，由女聲讀出。

4. 背景（jǐng）移（yí）除

可以實時的移除背景並替換成新的（de）背景。

應用場景：

5. 目標跟蹤

Metaio*3D目標跟蹤模塊（kuài）提供基於光學的跟蹤技術，可以跟蹤視頻序列或（huò）場景中的目標物。Metaio工具箱可以訓練、創建並編（biān）輯3D模型，這些模型可以傳（chuán）給各種目標檢測及跟蹤算法。

跟蹤技術支持平麵（miàn）的2D目標（biāo）跟蹤、基於特征的3D跟蹤、CAD模（mó）型的基於邊界的3D跟蹤及即時3D跟蹤。

6. 增強（qiáng）現實

用音頻、視頻、圖像或其他信息來（lái）添加、增強或補充英特爾實（shí）感技術遊戲的內容。

7. 三維掃描和打印

可以掃描、編輯、打印和分享（xiǎng）三維物體，並與 3D Systems展開合作。

目前因特爾已經與騰訊合（hé）作創立（lì）遊戲創新實驗室，推進實感技術，並打造了《軒轅傳奇》。與京東合作建立“京東因特爾聯合創新實驗室”，推（tuī）出虛擬試衣（yī）、3D物品展示等，使實感技（jì）術落地電商平台。同時因特爾自（zì）己也在不斷推出自己的實感（gǎn）技（jì）術產品。這（zhè）不前兩天在北京推出其全新的第五代酷睿處（chù）理（lǐ）器（qì）家族，搭載此處理器的多款產品還配備（bèi）了英特（tè）爾實感技術，看來這項技術很快就會遍地開花。

隻要你的處理器是第四代及四代以後（hòu）英特爾（ěr）® 酷睿™處理器，操作（zuò）係統滿足Microsoft* Windows 8.1（僅限64 bit），再外購一個英特爾® RealSense™ 3D 攝（shè）像頭就可以下載SDK玩起來。估計不久聯想、戴爾、華碩、宏基、惠普等等搭載第五代酷睿處理器（qì）並內嵌因特爾3D攝像頭的（de）超很本、二合一及一體機設備就會上市（shì），那（nà）時玩起來會更（gèng）爽。

資料來源：RealSenseSDKdesignGuidelinesGold

補充一點自己的實際體會（huì）：

1.基於結構光方案的深度相機，受光線影響很大，下午太陽光照進來，深度數據殘缺嚴重，這個就是所謂的激光散斑受（shòu）強光淹沒掉了。

2.手勢識（shí）別中，靜態手（shǒu）勢，手型識別效果不錯。同時，對著深度（dù）相機方向的（de）手勢運動，識別效果也不錯（cuò）。但左右方向的運動（dòng）手勢，效果（guǒ）很差。主（zhǔ）要是視（shì）場（chǎng）角小（xiǎo），深度數據殘缺嚴重。

3.SDK可（kě）支持多個設備（bèi）同時鏈接。采用一台設備，一個線程來管理維護。線程內部（bù），SDK所有（yǒu）功能都支持。也就是（shì）多個設備互不影響。

4.手勢，采用22點骨架模型。大致的手型是可以捕（bǔ）捉的，但是容易受到環境光影響，在準確獲取手部動（dòng）作時還是（shì）考（kǎo）慮使用專業的數據手套設備，比如WONGLOVE數據手套。

5.手勢識別，在20~55cm範（fàn）圍內可用。其實，整體來看，隻能是小範圍運動（dòng）情況了。

上一篇：UNITY3D使用C#腳本的幾（jǐ）種讀寫（xiě）TXT文本文件的方法 2019/11/12
下一篇：realsense顯示限定範圍內的圖像物體 2019/11/11