Talaan ng mga Nilalaman:
- Ganito gumagana ang algorithm ng Google
- Awtomatikong pagwawasto na isinasaalang-alang ang konteksto
- Siguro makikita natin ang teknolohiyang ito sa Pixel
Ang mga mananaliksik mula sa Google at MIT ay bumuo ng isang algorithm na naglalayong iwasto para sa mga bahid sa mga malawak na anggulo na pag-shot.
Maaaring nakita mo na ang mga mukha ng ilang mga tao ay mukhang nakaunat, bahagyang namilipit o may pagbaluktot sa mga larawan. Bagaman maaaring sanhi ito ng kaunting mga kasanayan ng litratista, ang totoo ay ang mga pag-shot gamit ang malapad na angulo ng lente mula sa mga mobile device na karaniwang nagdudulot ng pagbaluktot sa mga bagay o tao na nasa gilid ng imahe.
Mayroong iba't ibang mga pamamaraan na sumusubok na malutas ang problemang ito, ngunit hanggang ngayon wala pa kasing naging epektibo sa bagong panukala ng Google. Bagaman mukhang madali itong ayusin, hindi ito, dahil nangangailangan ito ng kumplikadong lokal na pag-edit na hindi nakakaapekto sa natitirang mga bagay sa larawan.
Ganito gumagana ang algorithm ng Google
Tulad ng ipinaliwanag ng mga mananaliksik, ang algorithm na ito ay nakakakita ng mga mukha at lumilikha ng isang mata na nagbibigay-daan upang awtomatikong baligtarin ang ganitong uri ng pagbaluktot kapag kumukuha ng isang shot na may isang malawak na anggulo tulad ng nakalarawan sa imahe:
Masasabi natin ang pagkakaiba kapag inilalapat ang algorithm na ito sa mga sumusunod na larawan. Ito ay isang selfie na kinunan ng isang malawak na anggulo ng lens na may 97 ° patlang ng view.
Ipinapakita ng unang imahe ang mga pagbaluktot sa mga mukha at ang pangalawa ay nagpapakita kung paano naibalik ng algorithm ang mga hugis ng mukha sa kanilang orihinal na estado.
Iyon ay, ang prosesong ito ay awtomatikong naaktibo kapag gumagamit ng malapad na anggulo, na nagbibigay ng espesyal na tulong sa mga mukha, ngunit hindi nagdudulot ng mga pagbabago sa natitirang imahe. At syempre, ang bilis ng awtomatikong pagwawasto na ito (mga 920 milliseconds) ay ginagawang imposible para sa mga gumagamit na makita.
Ayon sa kanilang mga pagsubok, matagumpay na gumagana ang algorithm na ito sa saklaw na 70 ° hanggang 120 ° sa larangan ng pagtingin, na sumasaklaw sa halos lahat ng mga posibilidad mula sa isang mobile device.
Upang samantalahin ang potensyal ng algorithm na ito, hindi kailangang gumawa ng anumang aksyon ang gumagamit o buhayin ang anumang espesyal na mode ng camera. Ang pagpapaandar na ito ay awtomatikong ipapatupad kapag nakita nito na ginagamit ang malawak na anggulo ng lens.
Awtomatikong pagwawasto na isinasaalang-alang ang konteksto
Maaari naming makita ang dynamics ng algorithm na ito sa sumusunod na video:
Awtomatikong itinatama ng algorithm na isinasaalang-alang ang natitirang mga bagay na lilitaw sa eksena, ginagawa ang buong konteksto ng litrato na magkasabay. Ang mga resulta ay natural nang walang mga detalye na nagpapakita na ang litrato ay nabago talaga.
Ang koponan sa likod ng proyektong ito ay nagbahagi ng isang gallery ng larawan sa Flickr na ipinapakita kung gaano iba't ibang pamamaraan ang tumutugon sa problemang ito kumpara sa dynamics ng kanilang algorithm. Mayroong higit sa 160 mga litrato (tulad ng nakikita mo sa simula ng artikulo) na makakatulong sa amin na suriin ang mga resulta.
Siguro makikita natin ang teknolohiyang ito sa Pixel
Inaasahan naming mailalapat ang algorithm na ito o ang ilang nagmulang teknolohiya sa susunod na henerasyon ng Pixel, dahil ang pangkat na lumahok sa proyektong ito ay mga empleyado ng Google.
Gayunpaman, sa dokumentong kanilang ibinahagi, wala silang nabanggit tungkol dito. Ang mga unang pagsubok na ito ng algorithm sa pagkilos ay matagumpay na ipinakita muli kung paano ang potensyal ng artipisyal na katalinuhan ay maaaring mapabuti ang dynamics ng mga mobile device at gawing mas madali ang buhay para sa mga gumagamit.
Dahil nang walang pag-aalinlangan, ang pagkakaroon ng isang katulad na pabagu-bago sa aming mobile device ay makatipid ng maraming sakit ng ulo at oras na sinusubukang i-edit ang mga pagbaluktot na ito sa mga larawan.