Rugalmas és biztonságérzetet teremtő szervezet egy bizonytalan korban
2024. november 11.
Mesterséges intelligencia a videós kontent gyártásban | Publikus
Feltöltés dátuma : 2022. február 24.
A mesterséges intelligencia alapú technológiák a tartalomgyártás olyan területeit is elérték, mint a videós anyagok készítése. Egyre gyakrabban hallani a deep fake veszélyeiről, de a technológiának a legális piacon is diszruptív szerepe van. Amihez eddig a szolgáltatóknak egy komplett szakembergárdásra és stúdióra volt szükségük, azt ma már startupperek egy szoftver segítségével hozzák, így töredékére csökkentve a vállalati videós anyagok bekerülési költségét, legyen szó a konkrét anyagiakról vagy az időtényezőről. De hol áll most ez a piac pontosan, és merre tart?
Ez alkalommal Kovács Dominik Máté, a Colossyan társalapítója és termékfejlesztési vezetője lesz a vendégünk, akik olyan nemzetközi partnerekkel dolgoznak, mint az Erste Bank, az LVMH, a World Economic Forum, vagy a Telenor. A beszélgetés során a következő kérdésekkel biztosan foglalkozunk:
Nagy Géza: – A mesterséges intelligencián alapuló videógyártás kezdi levetkőzni a gyerekcipőt. Ma már használják a marketingiparágban, az ügyfélkommunikációban, a szórakoztatóiparban, terápiás célra fejlesztenek anyagokat, de a csalók is felfedezték maguknak a technológiát, akik egy lépéssel mindig a piac előtt járnak.
Szeretettel köszöntök minden kedves nézőt, én Nagy Géza vagyok, a Protechtor főszervezője. A mai alkalommal Kovács Dominikkal, a Colossyan alapítójával és termékfejlesztési vezetőjével fogunk beszélgetni a technológiát érintő kihívásokról és piaci trendekről. Dominik, nagyon szépen köszönöm, hogy elfogadtad a felkérésünket és itt vagy velünk. Mondasz kérlek pár szót magadról és magatokról, mi az amit szerinted mindenképpen érdemes tudnia a nézőknek rólatok?
Kovács Dominik Máté: – Köszönöm szépen az intrót Géza, én mesterséges intelligenciával való szakirányban végeztem Dániában, azon belül is deep learninggel foglalkoztam, ami elég közel áll ezekkel a képekkel való manipulálásos, illetve detekciós témához, amivel ma is dolgozunk. Illetőleg még csináltunk egy startupot, amit defudgernek hívtak még 2018-ban, ami gyakorlatilag deepfake-ek és egyéb manipulatív tartalom detektálásával foglalkozott. Onnan született meg a mai Colossyannak a verziója, ahol gyakorlatilag én viszem a termékfejlesztést, és egy olyan terméket építünk, amellyel különböző felhasználók videókat készíthetnek, ahova embereket rakhatnak be gyakorlatilag 40-50 nyelven, és ezáltal saját üzleti céljaikra tartalmakat gyárthatnak. Legtöbbször jelenleg a platformunkon tréninganyagokat csinálnak, marketingvideókat illetve explainer videókat, amikkel gyakorlatilag különböző dolgokat, például e-fakeyoukat el lehet mondani.
Nagy Géza: – Szuper. Akkor innentől kezdve kérdés nélkül hiszek el neked bármit, amit mondani fogsz.
Kovács Dominik Máté: – Így van, így van. Sajnos, vagy szerencsére a technológia még nem jár ott, hogy realtime működjön. Szóval most nagyon nem tudnék ilyen magas minőségben realtime beszélni, úgymond manipuláltan, de azért pár év múlva lehet, hogy erre is lesz majd precedens.
Nagy Géza: – Ahogy olvastam azért erre már erősen folynak a kísérletek.
Kovács Dominik Máté: – Így van, még a Covid alatt 2020 elején mi is csináltunk erre egy ilyen megoldást. Nem volt egy magas high quality videóval rendelkező dolog, hogy realtime lehessen mozgatni egy embernek a száját. Meg lehet csinálni már most így realtime, csak még nem olyan magas felbontásban. Nagyon sok számítógépes erőforrás kell, amihez még további optimalizációs lépések lesznek a következő években, hogy ez úgy menjen.
Nagy Géza: – Jó, hát bele is kezdtünk igazság szerint az első kérdésünkbe, ami úgy hangzik, hogy hol tart a technológia, mit lehet vele megvalósítani, mik a limitációk?
Kovács Dominik Máté: – Ugye itt, ahonnan kiindulunk az a machine learningnek, azon belül is az úgynevezett deep learningnek az egyik ága. Ez azt jelenti, hogy a machine learningnek egy ágazata, ahol olyan algoritmusokat építünk, amik megtanulnak úgymond tanulni, és ezáltal adunk neki egy problémát, amire talál egy olyan megoldást, amit mondjuk én matematikai úton nem tudnék olyan jól feltalálni. A deep learning itt abban különbözik, hogy olyanfajta architektúrákat alkalmazunk ezekre az algoritmusokra, amik nagyon hasonlítanak az agynak a neuronjaira, ezáltal is ilyen hálókat, neutrális hálókat alkotó modellek az AI-n belül. Itt ágazik el még egyszer a dolog – amivel mi is foglalkozunk – a GAN-ek irányába, generative adversial networks ez azt jelenti, hogy gyakorlatilag ezeket a fajta deep learninges algoritmusokat arra használjuk fel, hogy új dolgokat kreáljanak. Mit jelent az, hogy új dolog? Például megtanítom az algoritmust, hogy találjon új emberekről fotókat. Erre biztos mindenki látott már példát. Van egy ilyen weboldal, a thispersondoesnotexist.com, oda felmegyünk, akkor egy új arcot látunk minden egyes alkalommal, amit az algoritmus kreált. Mi is ezzel az iránnyal foglalkozunk. Nem azzal, hogy új emberek arcát képezzük, hanem hogy a szájmozgást, meg az arckifejezéseket úgy modifikáljuk, hogy egy adott hanghullám alapján azt az arckifejezést mutassa egy adott ember arcán. Ezt a technológiát még nagyon sok ipar használja, kezdve onnan, hogy képeken belül is, például ha egy lakásról beszélünk, és csináltunk pár képet mondjuk tíz lakásról, akkor egy tizenegyediket a gép ki tud találni. Ha például egy portfóliót akarunk kreálni szép képekből, akkor ezt ki lehet bővíteni ezekkel az algoritmusokkal. Vagy például, hogyha hangról beszélünk, akkor meg lehet azt csinálni – mondjuk ez megint a rossz felhasználás, amit mondok példának –, hogy én beszélek a saját hangomon, és a Géza is beszél a saját hangján, akkor át lehet mappelni a kettőnk hangját, és a Géza meg tud szólalni az én hangomon valamit mondani. A deepfake-ek a videóknál is már előjöttek, és ott is lehet olyat csinálni, hogy emberek arcát átrakjuk egy másik ember arcára. Ebből nagyon sok botrány volt az utóbbi években, hogy legfőképp pornográf tartalomba belerakták sok hírességnek az arcát. Ez egyértelműen rossz használási mód. De ezen kívül lehet ezt a technológiát arra hasznosítani például, hogy vannak különböző olyan algoritmusok, amik az egészségügyi szektorban ilyen detekciós problémákat oldanak meg. Például készül egy röntgenfelvétel, nyilván egy algoritmus lehet, hogy jobban felfedez egy problémát ezen a felvételen, mint az emberi szem. Ahhoz, hogy ezt megtegye, ahhoz adat kell. Viszont ezeket a metódusokat fel lehet használni úgy is, hogy több adatot gyártsunk. Ahogy az előbb is említettem, hogyha mondjuk van tíz ember, és egy tizenegyediket, egy fikciós embert hoz létre ez a fajta metódus, akkor ezzel több adatot lehet csinálni, amivel – ezzel az egészségügyi példával élve – pontosságot lehet javítani. Szóval itt beszélünk jó meg rossz felhasználási módokról, de leginkább az, amivel mi foglalkozunk, én három kategóriába szedném, akár négybe is. Hangi felhasználások, videó, kép, és beszélhetünk itt akár még szövegbeliről. Az egyik erős példa a GPD 3, amit az Open AI hozott ki nemrég. Gyakorlatilag beírsz egy mondatot, vagy kettő mondatot, hogy milyen blogot akarsz írni, és akkor kiírja önmagától az egész blogodnak a szövegét. Ezt például én az egyetemi tanulmányaimnál is felhasználtam az egyik tanórám anyagához.
Nagy Géza: – Keressük a diplomamunkádban.
Kovács Dominik Máté: – Szóltam a professzornak, hogy ez így lesz, és tetszett neki, hogy ha már a technológiát toljuk előre, akkor nézzük meg, hogy mit tud helyettem is írni.
Nagy Géza: – Azt én is kipróbáltam, legalábbis a publikusat, amit kiraktak netre, és elég impresszív volt ahhoz képest, amit eddig lehetett tudni ezekről az eszközökről.
Kovács Dominik Máté: – Én használok ilyen terméket nap mint nap. Személy szerint én például a marketinges üzenetekben és kommunikációban nem érzem annyira erősnek magamat, és ezek az eszközök nagyon sokat segítenek. Esetleg van egy üzenetem, hogy ma 20 %-os promóció van a termékre, és akkor kiírnak erre nekem 50 féle különböző módot, ahogy ezt tudom közölni a közönségemmel. Több ilyen termék van, ami erre a GPD 3 technológiára épül. Ami a szövegbeli úgymond új adatgenerálás, ez nekem tényleg nagyon segít – mert a kreatív képességeim ezen a téren eléggé gyengék –, hogy lássak több példát, hogy hogyan lehet kommunikálni. És akkor az egyiket fogom, és azt használom. Tényleg ez egy jobbkezet ad nekem a kreálásban. Mi is hasonlót akarunk elérni a videóknál, hogy ne kelljen elmenni stúdióba, ne kelljen, hogy kamerát fogj, hanem gyakorlatilag meg lehessen azt csinálni, hogy megmondd egy interface-en keresztül a programnak, hogy mit szeretnél, és akkor csinálunk rá több tartalmat, több videót, ugyanaz mint a szövegnél.
Nagy Géza: – A tanulási folyamatnak, a technológiának a limitációja az miből fakad? A tanulási folyamatból, hogy még nincsen elég rendelkezésre álló adat, vagy pedig az infrastrukturális erőforrásokból, hogy ehhez kell a vas?
Kovács Dominik Máté: – Infrastruktúrában szerencsére nem annyira rossz a helyzet, mivel startup vagyunk mi specifikusan, és nagyon sok ingyenes kreditet lehet ilyenkor szerezni, hogyha a saját zsebünkből kéne fizetni még itt a sztori elején a sok modellnek a trénelését illetve a futtatását, az fájna. Most is nagyjából többezer dolláros havi szerverköltség van csak a modelljeink trénelésére. Szóval ez egy komoly összeg, meg nyilván a GPU. Folyamatosan küszködünk például abban, hogy productionban futtassuk a termékünket, hogy az Amazon adjon nekünk, vagy akár a Microsoft megfelelő mennyiségű GPU instance-t. Ugye a GPI miatt ez mindig közrejátszik sajnos. Nemcsak a költségeinket, hanem a sebességet is befolyásolja. De ami itt a legnagyobb limitáció, az az, hogy itt a technológiának ugye mindig vannak határai, és azon belül kell dolgozni. Itt jelenleg a határ, ahol mi dolgozunk az az, hogy nem lehet egy ilyen hollywoodi action filmet legenerálnunk még ezekkel az algoritmusokkal. Az embert be kell állítani a kamera elé, nem szabad, hogy a teste annyira mozogjon, mert hogyha mozog, akkor olyanfajta régióba megy az egész mozgása, amit nem tud leképezni az algoritmusunk, és ezáltal nem lesz vállalható az eredmény. Szóval mindig tanítjuk erre az ügyfeleinket, hogy igenis vannak a technológiának korlátjai. Szerintem a magunkfajta startupok tolják előre így az ipart. Most főleg, mert az akadémia az utóbbi 1-2 évben eléggé leállt ezen a viedós téren. Összességében azért haladunk előre, de még messze nem ott jár tényleg ez az egész, hogy akkor én most beállítok valakit a kamera elé, és 360 fokban megforgatom az embert, megcsinál 1-2 dolgot, és akkor már a következő actiont le tudom vele gyártani egy videóban. Ez nem így van, hanem csak egy adott snippetet, amikor tényleg így áll a kamera előtt az ember és magyaráz valamit.
Nagy Géza: – Maradva a fejlesztési vonalnál, hogyan néz ki maga ez a terület fejlesztési szempontból? Mik azok a kihívások, amikkel szembesültök? Említetted a chip-hiányt, milyen időskálában lehet gondolkodni, amikor valaki ezzel a területtel kezd el foglalkozni? Milyen üzleti erőforrásokra van szüksége ahhoz, hogy sikeresen lehessen működni ezen a pályán?
Kovács Dominik Máté: – Igazából szerintem mindenkitől azt hallja az ember, hogy az ő területe a legnehezebb. Ezt én sem tagadom, mert tényleg nagyon sok kihívás van azon a területen, ahol mi dolgozunk. Az egyik előnye az, hogy nagyon kevés új vetélytárs jelenik meg a piacon. Nekünk összeadva kb. másfél, akár kettő évbe tellett, hogy eljutottunk odáig, hogy a technológiánk működik. Legtöbb más ilyen ötletnél, amikor az ember startupot, vagy innovatív ötletet csinál, azért fel lehet mutatni valamit, ami valamennyire működik, akár hónapok munkája alatt. Ez lehet, hogy változni fog. Lehet, hogy egy év múlva, két év múlva el lehet jutni ugyanarra a szintre, ahol mi vagyunk három hónap alatt. Bőven lehet, de ahogy ma kinéz a terület, sajnos ebbe bele kell rakni nagyon sok időt és energiát, ami ugye sok pénz is, mert gyakorlatilag AI researchös szakemberekkel kell dolgozni, akik az egyik legdrágábbak a piacon. Azért ebbe kell befektetői pénz is, meg sok idő és rizikó. Ez viszont azt eredményezi ahogy mondtam, hogy nincsen szerencsére olyan sok vetélytársunk, a piac meg hatalmasnak néz ki, szóval ez egy előnyös helyzet. Ami még nagy kihívást jelent, az az, hogy ezt scalerve hogyan tudjuk productionbe rakni. Mert minden ilyen machine learninges sztori jól hangzik, de amikor arról beszélünk, hogy most kitaláltunk valamit, az működik, lefut a lokál számítógépemen vagy pedig valahol a felhőbe. De ezt hogyan tudjuk a kliensek elé rakni, hogyan tudjuk a felhasználók elé rakni? És ehhez egy nagyon komoly architektúrát kell építeni, hogy ez olyan szinten működjön, hogy az embernek ne kelljen várnia órákat, hogy lefut az algoritmus. Fontos, hogy egyszerre több embernek futhasson ez a deep learninges algoritmus, illetve hogy ez megbízhatóan is fusson. Erre nálunk külön DevOps-osok dolgoznak, hogy ez működjön. Ez ilyen szinten egy startupnál nem gyakori, viszont a technológiai nehézség miatt szükséges. Amit még megemlítenék, az egésznek a UI-a, ahogy elé tárod a felhasználó elé, hogy itt van ez a nagyon bonyolult dolog, amin tényleg kutatók dolgoztak, komplex egyenletekből áll, és ezt hogyan tudja a felhasználó olyan intuitívan megérteni, hogy ő ezt rögtön el tudja kezdeni használni, és látja benne az értéket. Ezért az egész frontend fejlesztés, ahogy elé tárod a user elé az egészet, az egy nagy kihívás szerintem.
Nagy Géza: – Ha csak pár technológiát megnevezel, mik a legfontosabbak, amiket használtok?
Kovács Dominik Máté: – Gyakorlatilag minden AI dolog pythonban megy. Nálunk specifikus programozási nyelvre illetendő, illetve amit mi használunk, ezt a deploymentet, ezt a productionba rakását az egésznek, mi AVS-en csináljuk. A legtöbb startup AVS-en működik az Amazonnál, mert nagyon-nagyon sok ingyen kreditet adnak. Ott is ilyen kubernetes clusterekkel dolgozunk, ami azt jelenti, hogy gyakorlatilag tudjuk ezt az egészet skillelni. Szóval, hogyha jön egy user, akkor az kap egy machine-t, akkor az az ő algoritmusa, de hogyha jön hirtelen ezer user, akkor megoldjuk azt, hogy ezer ilyen kép felröppenjen, és akkor így teljesen skillekből még megbízható a rendszerünk. Röviden így ezt használjuk, ami pedig a vizuális megjelenítést illeti, ott pedig igyekszünk a legújabb technológiákat használni a weben, hogy ez minél gyorsabban és működőképesebben üzemeljen.
Nagy Géza: – És mekkora csapattal működtök most, mit kell elképzelni a háttérben, akik ott vannak egy sikeresen induló startup mögött?
Kovács Dominik Máté: – Jelenleg mi seed-stádiumban vagyunk, ami azt jelenti, hogy most keressük a product market fitet, hogy legyen egy szignifikáns bevételünk, illetve hogy a termékünknek legyen egy elég erős felvevőpiaca. Ami bennünk különleges, hogy egy deeptech startup vagyunk, tehát researchöt is csinálunk. Van egy háromfős research-csapatunk, ők az AI-researchereink. Ők most is azon dolgoznak, hogy különböző emberekkel minél jobb minőségű arckifejezéseket tudjunk produkálni. A termékünk azt tudja, hogy beírsz egy szöveget, és azt az ember elmondja. Ezért kell az, hogy ők folyamatosan azon dolgozzanak, hogy ezt az algoritmust javítsuk, gyorsítsuk illetve minél élethűbbé tegyük az eredményt. Ezenkívül van egy 6-7 fős engineering fejlesztő csapatunk, ők itt vannak Budapesten, ők építik az egésznek az architektúráját a backendtől a frontendig. Illetve minden fejlesztést ezen belül ők menedzselnek. Van egy product designerünk, ő az utóbbi hónapokban csatlakozott, nagyon fontos volt, hogy amit építünk, az maximálisan felhasználóbarát legyen, egyszerű használatú, jól nézzen ki. Van még egy-két ember, aki segít minket brand design téren, valamint marketingben. Ezenkívül még vagyunk hárman alapítóként, én pedig a termékfejlesztést viszem a csapatban.
Nagy Géza: – A terveitekre rá lehet kérdezni? Publikus vonulatok, hogyha vannak benne. Milyen kilátásokkal számoltok a következő 1-2-3-4-5 évben?
Kovács Dominik Máté: – Mindenképpen azt látjuk, hogy ez a termék, amit fejlesztünk, elég sokáig el fog tudni minket vinni, ha sikeres lesz. Egy alternatívát akarunk adni, főleg kis cégeknek, hogy ne kelljen stúdiót használni, ne kelljen feltétlen a drága produkciós költségekbe belemenni, hanem úgy, mint egy szöveget, vagy egy emailt, tudjanak egy videót kreálni olcsón és megfizethető módon, és persze gyorsan. Hogyha ez a termékünk megtalálja ezt a felvevőpiacot amit említettem, akkor szeretnénk további piacokba bővülni. Nagyon-nagyon sok ötletünk van, illetve már van akkora validálásunk, hogy hova tudjuk ezt eljuttatni. Az én személyes kedvencem az a hírközlés. Rengeteg médiafelületen a cikkeket tömegével gyártják, de videó az nem olyan sok van. Hogyha csinál valaki egy videót, de azt a videót akár 3-4 nyelven főleg úgy, hogy Európában nagyon sok nyelv van az országok közt. Vagy például Indiában, ahol országon belül nagyon sok nyelv előfordul. Ez egy jó technológia, ami meg tudja változtatni a játékot abban, hogy a tartalmat az adott nyelvre csináld, és már videó formában, vagy cikkből videóba nagyon gyorsan és eredményesen. Szóval rengeteg ilyen ötletünk van, hogy hol lehetne még ezt a technológiát felhasználni, de most szeretnénk elsődlegesen arra fókuszálni, ami a legnagyobb felvevőpiac ebben, utána majd a következő években ezekbe a különböző szegmensekbe továbbhaladni. Jelenleg ez a növekedési stratégiánk.
Nagy Géza: – És milyen a piacnak a reakciója? Mondtad, hogy seed-fázisban vagytok, keresitek az érdeklődőket, valamint ahol el lehet hinteni a terméket. Mi a tapasztalat akár itt Magyarországon, akár globálisan, hogyan viszonyul a piac ezekhez a disztruktív technológiákhoz?
Kovács Dominik Máté: – Nagyon pozitív a fogadtatás igazából. Beszéltünk jópár más startuppal, nagyon más iparágakban. Nekünk az AI, vagyis a mesterséges intelligencia a közepe a termékünknek, illetve amiket csinálunk. Mi nem tudjuk csak úgy odarakni, hogy azért csináljuk ezt, hogy benne legyen a szó, hogy AI-jal foglalkozunk. Nekünk tényleg az a motorja az egész terméknek, anélkül egy Canva-copy lennénk, vagy nem egy nem megfelelő termék. Azt vesszük észre, hogy nagyon sok olyan korai fázisú felhasználónk és akár fizető kliensünk is van, aki nagyon motivált, nagyon – mondhatni – early adopter jellegű, mert szimplán nagyon szereti az ilyen AI-os innovációkat. És szerintem ez egy szerencsés helyzet, mert az ilyenfajta emberek visznek minket előre, az ilyenfajta cégek visznek minket előre, akik látják a víziót, látják, hogy hogyan tudnak a vetélytársaik elé kerülni, hogyha egy ilyen innovatív termékbe korán beszállnak. És szerintem az, hogy mi ezen a területen vagyunk, az nagyon sokat segít. Sok ilyen ember van még, Magyarországon belül is tapasztaljuk, ami szerintem igen jó. Talán leginnovatívabb az India, valamiért az ottani ügyfeleinken azt látjuk, hogy nagyon belemennek akár az ilyen váratlan vagy tudatlan helyzetekbe, hogy minél innovatívabbak legyenek. De természetesen az Egyesült Államokra, illetve általánosságban Európára is maximálisan célzunk, és szeretnénk, hogy itt is, illetve Amerikában is használjanak minket. Összességében azt látjuk, hogy sokan pozitívak, de van egy másik fajtajellegű ügyfél, illetve user, akinek még nem elég jó ez a technológia, ami teljesen megérthető, mi nem is őket szeretnénk most megszólítani. Reméljük, hogy a következő évek fejlesztésével, akár hónapok fejlesztésével minél több embernek fog ez tetszeni, és minél többen fogják látni benne a potenciált.
Nagy Géza: – Melyek azok az iparágak ahol a technológia jelenlegi szintjén már adaptálni lehet a mindennapi használatban a megoldásokat? Ugye mondtad, hogy kvázi statikus testtartású emberekről van szó, akiket ti tudtok szóra bírni, az anyagokban. Itt a szájmozgás, az arcmimika az, ami felhasználásra, manipulációra kerül. Hol, mely iparágakban találkoztok a legnagyobb nyitottsággal és felhasználási móddal ezzel kapcsolatban?
Kovács Dominik Máté: – Nagyon nyitottak érdekes módon a bankszektor, illetve a pénzügyi szektor, nagyon sokfajta kommunikációs anyaguk van. Mindig preferálják a videót, hogy a klienseikkel ilyen formában beszéljenek, vagy akár belsőleg ilyen prezentációkat csináljanak videó formában. Általánosságban pedig a nagyobb cégeknél az internal communication. Mondjuk az egyik department vezető szól a többi alkalmazottnak, hogy most nem kell bejönni pénteken, mert szabadság van. Ezt eddig ugye emailben csinálták, de próbálkoznak például ezt videó formában is. Illetve különböző olyan módok még itt belső kommunikációban, mint a tréningvideók. Ez az egyik legnagyobb irány, amit látunk, hogy az ilyen tréninganyagokat például onboarding, vagy amikor jön egy új ember a céghez, vagy pedig egy rendszernek a megtanítása ez mind-mind. Nagyon nyitottak rá, az összes jelenlegi ügyfelünk is. Azért ebből van a legtöbb, ezekből a tréningvideókból, látták benne a potenciált, hogyha odaraknak egy embert, akkor sokkal jobb ez, mint egy dokumentum, úgymond így videó formában. És ez több nyelven, ami szintén fontos például nagyobb cégeknél, akik több országban vannak jelen. Összességében ezt látjuk. Marketingre nem használják még, de promóciós anyagok elkészítése akár direktben az ügyfelekkel való kommunikációtartás marketing területén igen, illetve hírszolgáltatásra is. Van egy-két cég, itt dolgozunk az Axel Springerrel, ami a világ egyik legnagyobb digitális médiacége. A Times of Indiával is folynak itt különböző tesztek, ez India egyik legnagyobb médiacége. Nekem ezek személyesen a kedvenceim, mert érdekes. Az a nehéz, hogy nagyon sok mindenre lehet felhasználni ezt az egészet, és a legnehezebb nemet mondani. Mert muszáj a terméket is ugyanolyan irányba vinni, ahol most van rá igény, és ezt most ki tudjuk használni, hogy később mindenki máshoz is eljusson.
Nagy Géza: – Hogy találjátok meg ezeket a partnereket? Mert azért igazán nívós partnereket sikerült most felsorolnod. Mik azok a fórumok ahol meg lehet őket találni, és mik az ügyfelek elvárásai főleg ebben a fázisban, ahol most tart a technológia?
Kovács Dominik Máté: – Hát ez egy ilyen disztribúciós kérdés, ezt még mi sem tudjuk annyira pontosan. Igazából, ha tudnánk, akkor már egy szinttel előrébb lennénk, de próbálkozunk sok mindennel. Tesztelünk különböző dolgokat, ahogy eddig salesszel próbálkoztunk, voltak saleseseink, ez végül annak ellenére, hogy tényleg bejött egy-két nagyobb név, összességében szerintem nem vált be. Most ezzel a durvább croft maketinggel próbálkozunk, hogy olyan terméket építünk, amit szájhagyomány útján terjedve az emberek megmutatnak egymásnak, mert annyira innovatív tud lenni és annyira vizuális, hogy így tud terjedni akár cégeken belül. Illetve, még ami fontos lehet, ilyen általános marketingstratégiák, hogy social médián szeretnénk most felfuttatni az egészet, valamint különböző publikációk, PR-lehetőségek. Így szerezzük az ügyfeleink nagy részét, ezekkel kísérletezünk még, nem nagyon tudom megmondani hogy mi működik a legjobban, de remélem hogy kettő hónap múlva ezt már jobban fogom tudni. Válaszolva a másik kérdésedre, igazából csak megint az tudom mondani, hogy van, akinek nagyon tetszik az egész, és látja benne a potenciált, és képes fizetni érte. Ennek mi nagyon örülünk. A másik pedig az, akik úgymond látják, hogy mit lehetne még javítani. Azokra az emberekre, illetve cégekre nagyon figyelünk, mert nagyon jó visszajelzést adnak, és tényleg ez alapján majd el tudunk jutni egy olyan szintre, ahol az ő igényeiknek is maximálisan meg tud felelni a sztori, ami nyilván idő és pénz.
Nagy Géza: – Challengelnek titeket fejlesztési téren? Úgy értem, az alapkoncepción kívül, amin dolgoztok, visszahat-e ez az együttműködés arra, hogy új és új szempontokat építsetek be? Egy Times of India lehetséges, hogy teljesen más aspektusokkal közelít egy-egy kérdéshez, mint egy bankszektori szereplő?
Kovács Dominik Máté: – Itt jön főleg az én szerepem, lényegében én ezzel foglalkozom, hogy prioritásokat kezelek megfelelően. Tehát nem szeretnénk egy custom solutionné válni a Times of Indiának, nem szeretnénk egy bankszektorban egy szereplőnek mindent megcsinálni és minden mást ignorálni. Szeretnénk egy olyan úton haladni, ahol egy adott szegmensnek egy adott szektort jól ki tudunk szolgáltatni és általánosságban meg vannak elégedve az általunk fejlesztett újításokkal. Utána majd aztán további piacokra ráfókuszálunk. Most egyelőre elutasítunk minden olyan kérést, ami egyetlenegy ügyfélen kívül senki másnak nem tetszik, mert valamennyire egy olyan szoftvert szeretnénk csinálni, ami egy adott piacot kiszolgál. Vannak ilyen esetek igen, nehéz nemet mondani, nemet mondani a legnehezebb. Ezt sok év hibázás után tanultuk meg.
Nagy Géza: – Ismerős. A globális trendeket tekintve hogy látjátok, mik a piaci prioritások, mi az, amit vár a piac ettől a technológiától?
Kovács Dominik Máté: – Vannak ilyen hosszútávú víziók a meglévő cégekkel, akikkel ezen iparon belül dolgozunk. Például az, hogy 5-10 év múlva akár egy Hollywood-szerű kisebb filmet ugyanúgy le fogsz tudni generálni, mint most egy ilyen videót a mi termékünkkel. Tehát hogy nem kell egy stáb, nem kell több kamera, nem kell az a masszív produkciós költség, hanem a kreatív ötleteket véve előre meg lehet csinálni ezeket a videókat, le lehet gyártani a tartalmat. Ez így a hosszabb távú vízió. Hogy hogyan fogunk ide jutni, az még szerintem mindenki számára kérdőjeles. A következő ilyen my stone az egészben az az, hogy szerintem – ami nekem a személyes kedvencem – oké, hogy megvan egy ember, – ezek amúgy igazi emberek, akiket felveszünk a stúdióban – de sims-szerűen lehet változtatni a kinézetüket. Sokszor van ilyen kritika, hogy nem tetszik nekem ez a színész, mert vörös a haja, akkor lehessen a hajának a színét megváltoztatni. Ez még eléggé nehéz jelenleg videós formában. Láthattunk már példákat a képi világban, amikor ezt az előbb említett generative adversial networksöket erre használták fel, hogy van egy kép mondjuk rólam, és ősszé tesszük a hajam vagy szakállat csinálnak nekem. Volt itt a FaceApp nevű telefonos alkalmazás, az is ezzel foglalkozott. Az hogy ezt jó minőségben videóval tudjuk megcsinálni, arra én még személyesen nem láttam példát, lehet hogy már van, de szerintem nem vagyunk már messze ettől. Érdekes lenne például azt csinálni, hogy ezeket a színészeket, akik nekünk is vannak, különböző karakterisztikájukat változtatgatni. Akár ahhoz a tartalomhoz, amit jelenleg csinálsz, például egy olyan marketingvideóhoz, ami egy adott célközönségnek szól.
Nagy Géza: – Ez tulajdonképpen akkor egy ilyen AI generálta CGI lesz gyakorlatilag?
Kovács Dominik Máté: – Hát nem CGI, mert ezek igazi emberek, akikkel dolgozunk. És ez a különbség a CGI meg köztünk, hogy ebből nem lehet megmondani, hogy ez gép által generált, mert ez ténylegesen egy igazi emberi textúra, ami ott van, olyan, mintha kamerával lett volna felvéve.
Nagy Géza: – Modifikációra gondolok az emberi karakteren, mikor már elváltoztatod.
Kovács Dominik Máté: – Igen, igen. Hát mondhatni így is hogy CGI, de kicsit távolodnék ettől a szótól.
Nagy Géza: – A totál amatőr szólt belőlem, tehát mea culpa.
Kovács Dominik Máté: – Semmi gond persze, csak egy kicsit más a kettő szerintem így összhatásra.
Nagy Géza: – Milyen különbségeket látsz például a magyar és a globális piac között? Azért az egy általános tapasztalat, hogy mi általában kullogunk a globális piac mögött és adaptáljuk azokat a technológiákat amik onnan érkeznek. Közben mégis nagyon jó azokat a kivételeket látni, amilyenek ti vagytok. Vagy múlt héten egy Bitrise-es beszélgetésünk volt itt a Protechtoron és ők is piacvezetővé nőtték ki magukat a Mobile DevOps piacon.
Kovács Dominik Máté: – Igazából itt a magyar példával élve, az egyik legnagyobb kihívás, amit majd meg kell oldani, hogyha mi szövegből csinálunk videót, a szövegből hangot, aztán a hangból videót. A magyar nyelv elég különleges, és emiatt nagyon kevés jó minőségű hang érhető el ezzel a text-to-speach technológiával amit használunk. Amikor a Google Transit-be is beírunk valamit, akkor ilyen robotos magyar hang van. Nyilván annál már vannak jobbak, de nem akkora a repertoár, mint az angol hangoknál. Szerintem, hogyha sokkal több magyar lehetőség lenne, meg sokkal több magyar hang lenne, akkor mondhatnám azt, hogy egyenlő a pálya. A mi algoritmusunknál is látunk olyat, hogy például amikor angol kifejezéseket akarunk kiejtetni az emberekkel akiket felveszünk, akkor az pontos, meg nagyon jól működik, de például amikor magyar hanggal csináljuk, akkor lehet hogy előfordul olyan, ami az angol hangnál nem. És ez sajnos a nyelvnek a karakterisztikájából jön, illetve abból, hogy azokban a data setekben amikkel mi tréneljük ezeket a modelleket amiket használunk, azokban nyilván a magyar nincs annyira jelen. Ezt még javítani kell, ezen még dolgozni kell, szóval talán az egyetlen tényleg ilyen hátrányt a magyar nyelv sajátosságában látok, ami a mi területünket illeti. Technológiai limitáció, egy technológiai nehézség.
Nagy Géza: – Ez amúgy rétegezve hogy néz ki technológiailag, hogy az algoritmusra először ráhúzzátok a hangsávot? Megtanulja, hogy melyik szót hogy kell formálni, és a mimika a következő, ami az adott szavaknak a kiejtéséhez igazodik? Vagy ezt hogy kell elképzelni technológiai oldalról?
Kovács Dominik Máté: – Úgy kell elképzelni, hogy amikor a kamera elé például beállítanánk téged, akkor megkérnénk téged, hogy olvass fel egy szöveget, és abból a szövegből a mi algoritmusunk megtanulja, hogy hogyan mondasz ki különböző hangokat. Ez általában angolra van optimalizálva, és az angolnak a hangzása meg a kiejtése az eléggé más a magyartól. Lehet különböző technikákat használni, amiket használnak a deep learningen belül. Ezeken dolgozunk mi is, hogy valami alá generalizáljuk az egészet, hogy általánosítsuk, és hogy több nyelven is működjön. Ez nem egy egyszerű dolog, ezt eléggé nehéz megcsinálni úgy, hogy vannak olyan nyelvek is, amik néha még nehezebbek is akár, mint a magyar. Dolgozunk ezen, aztán majd meglátjuk, hogy hova jutunk ebben. Röviden így működik a technikánk, és amikor beraksz egy új hangot, egy új szöveget, akkor az algoritmus tudni fogja, hogy egy adott hangra, egy adott hangzásra milyen szájmozgás, arckifejezés illik.
Nagy Géza: – Akkor ez lényegében azt jelenti, hogy meg kell tanítani beszélni az elejétől az algoritmust. Minden egyes szónak a kiejtése, hangzása, ami azért egy irgalmatlan tanulási folyamatnak hangzik.
Kovács Dominik Máté: – Így van. Nagyon sok idő az iterációja ezeknek a modelleknek, illetve nagyon sok adatot is igényel.
Nagy Géza: – Ezeket az adatokat honnan nyeritek? Mert azért feltételezem, nem ültetitek le a színészt minden egyes esethez.
Kovács Dominik Máté: – De. Színészeink nagyon szorgalmasak, és hajlandóak voltak hosszú szövegeket felmondani, és innen van ilyen sok adat.
Nagy Géza: – És most valószínűleg megint a laikus kérdez belőlem, hogy az nem opció hogy rászabadítjátok az internetre és tanulj tinó?
Kovács Dominik Máté: – Azért nem, mert ezeket egy mesterséges settingbe kell felvenni, ami nálunk a stúdiót jelenti. Ha behoznánk ilyen internetes minőséget az egészbe, káosz lenne. Ugye ez egy technológiai limitáció, hogy nekünk kell ezt a mesterséges körülményt megteremteni és ezen belül dolgozni.
Nagy Géza: – Kicsit nézzük meg kérlek befektetői oldalról, hogy onnan milyen érdeklődést lehet tapasztalni, mennyire nyitottak a tőkebefektetők, meg különböző csoportok arra, hogy ezt a technológiát supportálják. Mennyire látják benne a fantáziát?
Kovács Dominik Máté: – Most nagyon jól áll a szénánk ebben az esetben. Volt egy karácsonyi vacsoránk az egész startuppal, és pont akkor, a vacsora közben jelent meg a hír, hogy a legnagyobb vetélytársunk, ha jól emlékszem 40 millió dollárt gyűjtött a Series B körben, ami egy eszméletlen nagy pénz, az eddigi legnagyobb ezen az egész szintetikus média területen belül, ahol mi mozgunk. Rögtön ezután azt tapasztaltuk, hogy mindenki keresi a következőt, hogy kibe invesztálhatnak még be. Most úgy érezzük, hogy elég nagy az érdeklődés és a pozitivitás az iparágunkra, és ezt ma is tapasztaljuk. Reméljük ez a következő hónapokban és esetleg éven belül is fennmarad, és ebből mi is tudunk profitálni.
Nagy Géza: – Általánosságban értelmezhető ez az érdeklődés? Vagy itt a szintetikus médián belül vannak területek amik triggerelik a befektetni vágyókat?
Kovács Dominik Máté: – Ez érdekes, ugye itt a szintetikus médián belül nemcsak videó van, hanem ahogy említettem van szöveg, kép, hang. Most a videó főleg, mert a videós vetélytársunk tervezi, és az egyik legnagyobb összeget így sikerült bevonzania. Nagyon híres nevekkel dolgoztak együtt, amit mi is tervezünk a következő hónapokra megtenni, és reméljük akkor a deputációnk, főleg az üzletünk piaci stabilitása is nőni fog.
Nagy Géza: – Szurkolok mindenképpen.
Kovács Dominik Máté: – Köszönjük.
Nagy Géza: – Forduljunk rá kicsit a technológiának a kockázataira, mert ugye vannak azért benne bőven. A képi világban – már fényképes oldalra gondolok – a deepfake azért már egy ideje tapasztalható mint jelenség, védekezni is próbálunk ellene. De hogy ennek azért a következő és egy jóval nehezebben kezelhető szintje ez pont a videós anyagoknak a manipulációja lesz. Ahogy már te is említetted, voltak ebből botrányok a pornóvilágban, hogy hírességek arcait bevágták a karakterekre. Hogyan lehet ez ellen védekezni? Egyáltalán hol tart a deepfake?
Kovács Dominik Máté: – Ezzel mi is foglalkoztunk. Ugye itt az a lényege az egésznek, hogy a deepfake-et te AI-jel csinálod, ami egy valamennyire nem determinisztikus, egy ilyen black box jellegű algoritmus, amire nehéz rájönnöd, hogy az most hogyan működik. Ezért szintén nehéz egy olyan algoritmust ráírnod, ami ezt detektálja, mert ott most beírod manuálisan a logikát, azt nem nagyon fogod tudni megcsinálni, mert annyira komplex. Ezért akkor kigondolod, hogy oké itt van egy mesterséges intelligencia által kreált szülemény, hogy ezt detektáljam, hát rádobok egy másik ilyen algoritmust, ami mesterséges intelligenciával működik, ezért elindul egy cat and mouse game. Egyszer az egyik jár a másik felett, aztán a másik. Aztán jönnek azok az emberek, akik generálnak, kitalálnak egy olyan metódust, amit nem tud az akkori detektáló algoritmus megtalálni. Akkor megint jön a detektálós comet, és kitalálja, hogy hogyan fejlessze azt. Ez megy tovább a végtelenségig, mert gyakorlatilag ez a kettő elempólus így egymás ellen játszik. Erre egy jó innovációt talált az Adobe cég, illetve kollaboráció több más cég között ilyen visual prominence-ben ami azt jelenti, hogy kitaláltak egy újabb fájlformátumot, ahol a metadatája a fájloknak az nem nagyon módosítható. Ez azt jelenti, hogy jelenleg most én el tudok neked küldeni képet, és ami benne van a metadatájába a fájl mögötti adatban, hogy én ezt photoshoppal manipuláltam, vagy mondjuk egy algoritmus által. Ezt én most ki tudom törölni. Azt találták ki itt, hogy egy úgynevezett passzív detekcióval meg lehet csinálni, hogy ezt ne lehessen modifikálni ezáltal. Hogyha például egy hírügynökséghez vagy bárhová eljut egy ilyen fájl, akkor meg tudják nézni, hogy mi történt vele ezelőtt. Ez még nincsen széleskörűen használva, ez még egy kutatás, valamennyire vannak már eredményei. Szerintem ez az igazi megoldás, mert amit az elején említettem az egy aktív detekció, ami azt jelenti, hogy lefuttatok egy algoritmust egy másik algoritmus ellen, ez pedig egy ilyen passzív hozzáállás az egész problémához, hogy akkor megakadályozzuk azt, hogy egyáltalán ezt meg lehessen hamisítani úgymond annyira, hogy ne lássam a múltját egy adatfájlnak. Jelenleg személyesen én azt látom, hogy ez nagyon jó irány, és remélem, hogy ez el fog terjedni minél hamarabb. Ezt mi is szeretnénk támogatni. Azok a dolgok, amiket mi csinálunk, fájlok meg videók, azok is ezzel a technológiával lesznek ellátva és fingerprintelve.
Nagy Géza: – Hogyha jól értem, ez azt teszi lehetővé, hogy azt a technológiát, amit ti fejlesztetek, azzal ne lehessen visszaélni.
Kovács Dominik Máté: – Pontosan. Mi ezt nagyon fontosnak tartjuk. Most se lehet ezzel visszaélni őszintén, mert nem tudod berakni semelyik korszaknak sem a miniszterelnökét, mert ahogy mondtam, ez egy nagyon sok adatot igénylő és professzionális felvételek sokasága egy stúdióban. Ez nem is nagyon fog működni, nincs is rá feature, nincs is rá megoldás jelenleg. Csak a mi színészeinket lehet használni, és velük különböző dolgokat beszéltetni, de ezenkívül vannak még benne moderációs és egyéb biztonsági eljárások.
Nagy Géza: – Itt akkor azért elmondható, hogy a fantázia, és a félelem a félelemtől előbbre jár, mint a technológia maga?
Kovács Dominik Máté: – Egyértelműen. Amikor csináltuk a startupunkat 2018-ban, akkor mindenki félt, hogy a deepfake-ek elárasztják a médiát, és mekkora dezinformáció lesz vizuális téren. Nagyon magabiztosan jelentem ki, hogy azóta még mindig a photoshopolt képek, meg a 15 éve itt lévő manipulált dolgok sokkal gyakoribbak, mert egyszerűbb megcsinálni, jobban hozzá vannak szokva az emberek és akik kreálják. Szerintem a deepfake még mindig a holnap problémája, nem a máé.
Nagy Géza: – És hogyha elérjük a holnapot? Ugye azért is kérdeztem, hogy itt a saját terméketeket tudjátok levédeni, hogy azzal ne éljenek vissza, ami nyilván már egy nagy előrelépés. De talán az lesz a keresztkérdés, amikor valaki szándékosan azzal a céllal fejleszt egy terméket, hogy márpedig azzal visszaélni lehessen. Hogyan lehet lebuktatni egy AI generálta videót? Vannak-e olyan ismertetőjelek, amik felismerhetővé teszik, hogy igen, ez a laikus szemnek rettentően hiteles, de technológiailag hol fogható meg az, hogy elemzed, hogy mi az, ami előtted történik?
Kovács Dominik Máté: – Hogy ma hogyan lehet lebuktatni egy ilyen videót szemmel? Arra gondolsz pontosan?
Nagy Géza: – Igen, és hogy mik az irányok? Hogyha egyáltalán vannak már ilyen kutatási irányok, meg fejlesztési irányok.
Kovács Dominik Máté: – Én azt mondanám, hogy ma szabad szemmel már nagyon nehéz megkülönböztetni a valóditól. Nyilván hogyha valaki húsz ilyen videót néz minden nap, akkor tudja, hogy mire figyeljen, de általánosságban azt mondanám, hogy nagyon nehéz. Amilyen irányok vannak ma és működnek, az tényleg ez az előbbi kutatás, amit mondtam, ez a provenance trackinges a fájlokra kiterjedve. Vannak nyilván ilyen algoritmusok, biztos sok médiavállalat vagy akár pénzügyi cég használ ilyet dokumentum-verifikálásra. Ami úgymond a közösség számára is elérhető, arra most így hirtelen nem nagyon tudok példát. Mi szeretnénk majd kiadni ilyet, mivel mi kettő évet beleöltünk abba, hogy egy ilyen algoritmust fejlesszünk, ami eléggé jó irányba haladt. Felhasználva mostani tudásunkat, hogy hogyan működik ezeknek a generálása, nagyon értékes lenne, hogyha kiraknánk egy ilyen megoldást. Szóval mi szeretnénk ebben lépni.
Nagy Géza: – S ennek a megoldásnak mi a működési alapja – bár nyilván ne menjünk bele, ha kezdek olyan dolgokat feszegetni, ami már üzleti titok vagy érdek – maga a látott valóságnak, „videós valóságnak”, vagy pedig a fájlformátumban való keresésnek? Ezekből kiindulva dolgozik a rendszer?
Kovács Dominik Máté: – Az volt a stratégiánk, hogy nézzünk mindent. Nézzük a fájlba való inkozisztenciát, nézzük magát a képi tartalmat, nézzük meg az internetet, nézzük meg hogy hol jelent meg ez a fájl, milyen kontextusban, és ezt próbáljuk minél automatikusabban. Nekünk az volt a logikánk, ilyen 3 layer system, ami különböző dolgokat néz. Ez szerintem egy nagyon jó indulás, de a legnagyobb core eleme az egésznek az az, hogy magát a vizuális részét nézi. Itt nagyon sok metódus van évről évre, mindegyik máshogy működik, másféle deepfake-ekre. Mondok egy példát. Az egyik az íriszből, a szemből kiveszi, hogy mekkora a pulzusod és akkor ez most mennyire rezonál, mennyire statikus. Mert ha statikus, akkor az egy kicsit fura, akkor arra lehet következtetni, hogy hamis arctextúra ami rajtad van. Nagyon sok metódus van, akár arcbőrből is ki lehet nézni különböző pulzálásokat és akkor abból következtetni. Azt is meg lehet csinálni, hogy absztrakcióban feljebb lépsz, és azt mondod, hogy akkor itt van ezer darab hamis videó, meg ezer darab igazi videó, itt van a neural networköm, és akkor kezdjünk el egy trénelést. Tanítsuk meg a hálózatot, hogy ez az igazi, ez a hamis, reméljük, hogy ő is meg fogja tanulni, mint egy csecsemő. Ez egy általános deep learninges hasonlat. Nagyon sok ilyen metódus van, mi személy szerint kipróbáltunk 3-5-öt, amit le is fejlesztettünk. Akik aktívan foglalkoznak ezzel, még ők sem tudják megmondani szerintem, hogy melyik a nyerő, melyik a legjobb. Szerintem minél többet kell használni amik jelenleg a legjobbak, és abból lehet egy összképet kapni.
Nagy Géza: – Igen, és ahogy mondod is, ez egy macska-egér játék, mert az ellen úgyis mindig fejleszt egy másik megoldást, amit meg le kell követni.
Kovács Dominik Máté: – Így van.
Nagy Géza: – Esetleg hogyha a nézők között felmerül bármilyen kérdés, azt nyugodtan dobjátok be a Q & A-be, mert Dominik szívesen megválaszolja, hogyha megválaszolható.
Ami még felmerült bennem, hogy beszéltünk a technológia fogadtatásáról üzleti oldalról, mint üzleti felhasználók. De társadalmi visszajelzésekkel is találkoztok, hogy maga az általános társadalmi közeg, amiben működtök – emberek, munkavállalók – hogyan értékelik az ezzel való találkozást, mennyire lelkesednek?
Kovács Dominik Máté: – Nagyon sok társadalmi visszajelzéssel találkozunk. Igazából ilyen nagyon negatívval, vagy nagyon-nagyon pozitívval elég ritkán. Inkább a köztes sávba tudnám elhelyezni azt, amit itt tapasztalunk. Mi nagyon fontosnak tartjuk, hogy a legbiztonságosabb cég legyünk, már a múltunkból adódóan, hogy nagyon sokat foglalkoztunk ennek a biztonságos részén elhelyezkedő technológiával. Szerintem ezt a tudást nagyon jól lehet majd hasznosítani arra, hogy időről időre ezeket, amiket felfedeztünk, implementáljuk a mi saját rendszerünkbe. Szeretnénk azt, hogy az emberek úgy ismerjenek minket, – hogyha erről a területről van szó, és érdekli őket a biztonság – hogy hozzánk forduljanak.
Nagy Géza: – Szuperül hangzik.
Kovács Dominik Máté: – Igazából most átmegyünk egy ilyen fun fact rebrandinges folyamatba, megváltoztatjuk az egész brandünket, és szeretnénk majd ezt is reprezentálni benne.
Nagy Géza: – Ennek okáról elárulható valami?
Kovács Dominik Máté: – Nemrég kaptuk meg az első nagyobb startup befektetésünket, és szeretnénk egy komolyabb karakterisztikát meg jellemet a cégünknek és szeretnénk az egyik core value-nak ezt megtartani hosszútávon. Szeretnénk ezt a technológiát biztonságban tartani és ezért is tenni mind fejlesztés, mind kommunikáció terén.
Nagy Géza: – Közben valaki kérdezi, mert nem volt itt az elején, hogy volt-e róla szó, hogy magyar csapat vagytok, de Németországban?
Kovács Dominik Máté: – Gyakorlatilag úgy indult, hogy Koppenhágában alakultunk jópár éve, aztán Németországban bekerültünk Európa legjobb startup acceleratorába, ami az Axel Springeré és a Porschéé. Akkor Berlinben voltunk sok ideig, most pedig nemrégiben csináltunk Budapesten egy fejlesztői, illetve egy termékfejlesztési irodát, most jelenleg én itt vagyok. Vannak csapattagjaink Pakisztánban, Indiában, Koszovóban, Törökországban és Európa több országában, szóval így teljes mértékben nemzetközi a csapatunk. Főleg a fejlesztés és a termékfejlesztés az Budapesten zajlik. Most ez a felállásunk.
Nagy Géza: – Akikről beszéltél akkor korábban ők core csapat voltak? És emellett vannak még többen mellettetek, hogyha jól értelek?
Kovács Dominik Máté: – Mindenki a core csapat őszintén. A researchereink többsége például Pakisztánban van, most itt vannak velünk Budapesten. Igazából muszáj ott world talent pool-ból építkeznünk, mert 50 ember van az egész világon aki ehhez a területhez ért. Szerencsére az egyiket megtaláltuk, pont ott Pakisztánban, ő az egyik legnagyobb tagja a csapatunknak, ő a lead researcherünk.
Nagy Géza: – Igen, ez is egy érdekes kérdés, hogy a novot azt honnan lehet bevonzani?
Kovács Dominik Máté: – Erre van egy jó tippem, próbálkoztunk mindennel. Nem azt mondom, hogy ez az amit csinálni kell, de így jött be nekünk. GateHubon folyamatosan néztem, hogy mik az új fejlemények, új kutatások. Az egyik ilyen issue-ba ráírtam erre a jelenlegi kollégánkra, és így lett a csapat tagja.
Nagy Géza: – Közben Róbert kérdezi, hogy milyen eszközökkel menedzselitek a remote csapatokat?
Kovács Dominik Máté: – Nagyon jó kérdés. Amíg nem volt sok pénzünk, addig Telegramon folyt két és fél éven át, három éven át az egész céges kommunikáció. Eléggé komfortos volt. Aztán most már slackezünk, ez kicsit így erőteljesebb. Az mellett meg mindent Task Managementben, a dokumentációt ClickUpon csináljuk elég régóta. Szerintem a ClickUp nagyon jó, kicsit komplex, de nagyon jól megtanulható task management tool, mint a Trello. Ezenkívül meg nem Zoomozunk, hanem Aroundozunk. Ez egy nagyon jó video conferencing tool, sokkal jobb meg ingyenes is, tényleg nagyon élvezzük. Ez a három pillére a remote dolgozásunknak én azt mondanám. Meg persze Drive meg Calendar. De jó a kérdés, ezen mi is sokat dolgoztunk, hogy mi lehet a legjobb, és hogy így kialakítsuk. Meg aztán persze GateHub, fejlesztői dolgok.
Nagy Géza: – DevOps pipeline-hoz mit használtok?
Kovács Dominik Máté: – Az most egy kicsit kaotikus, mert az egészet átmigráljuk. Én nem vagyok benne nagyon a folyamatban, eddig GitLab-en voltunk, és annak a szolgáltatásait használtuk. Hogy a stabilitásunkat is erősítsük egy kicsit, majd ezen most fogunk javítani.
Nagy Géza: – Egy picit tudnál még beszélni a végfelhasználók felé való termékfejlesztés során milyen kritériumokat vesztek figyelembe?
Kovács Dominik Máté: – Nagyon jó kérdés, igazából próbáltuk definiálni, hogy mi a legfontosabb általában a legtöbb végfelhasználónak. Itt azokat vettük figyelembe, hogy egy nagyon könnyű felülethasználatot biztosítsunk, hogy ne kelljen semmilyen technológiai vagy videós tudás mielőtt valaki megérkezik a termékünkbe és jól tudja használni, hanem gyorsan egy jó minőségű videót kapjon. Ezek a legfőbb pillérei. Egyik legnagyobb kritérium, amit megfigyelünk az az, hogyha valakitől kapunk egy visszajelzést, az beleillik-e valamelyik célzott szegmensünkbe. Mert hogyha egy teljesen olyanfajta visszajelzés jön egy olyanfajta irányból amiről eddig nem tudunk semmit, vagy nem összeegyeztethető a többi felhasználó akaratával, akkor az egy elég nagy kérdőjel, és akkor azt át kell gondoljuk, hogy mit kezdjünk vele. Ez az általános reakciója az ilyenfajta visszajelzéseknek, amit így tudok példának mondani. De ezen a fajta szegmentálási irányon haladunk legtöbbször. Hogyha például egy hírközlésből jövő visszajelzés jön, akkor hogyan reagálná le a többi hírközléssel foglalkozó cég, ha mondjuk egy adott fejlesztést megcsinálnánk. Ezáltal folyamatosan kapcsolatban vagyunk a felhasználóinkkal, és beszélgetünk velük, megkérdezzük, hogy mit gondolnak egy ilyenfajta újításról. Valamennyire próbáljuk szintben tartani az egészet, hogy ne csak megint egy ember irányába menjen a fejlesztés.
Jött még egy kérdés, hogy hogyan teszteljük a fejlesztéseket? Kis startup vagyunk, 13-14-en vagyunk. A tanácsadóinktól azt a tippet kaptuk, hogy ezt nekem kell csinálni. Szóval általában a hétvégéim arra mennek el, hogy amit a héten megcsinálunk és kirakunk a tesztelői környezetbe, akkor én azt letesztelem és megpróbálom minél nagyobb minőségben megmondani, hogy mi volt a rossz, min kell javítani, mi a jó, és akkor azt rakjuk ki mindig. Nagyon fontosnak tartom, hogy heti release-ket csinálunk, ez azt jelenti, hogy hetente érkeznek szignifikáns újítások. Sok cég például ennél hosszabb iterációkkal dolgozik. Mi fontosnak tartjuk ezt a heti iterációt, heti sprintet, heti release-t, mert így nagyon-nagyon gyorsan, dinamikusan fejlődik a termék, és ezt a felhasználóink, az ügyfeleink is értékelik, hogy mondanak valamit, és azt eszméletlen gyorsan meg tudjuk csinálni vagy kijavítani. Szóval ahhoz, hogy ez a heti release menjen, ahhoz valakinek tesztelni kell, jelenleg ez én vagyok hétvégente. Szerintem majd ha stabilabban állunk, és egyre több ügyfelünk lesz, akkor erre külön QA csapatot építünk.
Nagy Géza: – Ennek a kérdésnek, illetve a válaszod kapcsán merült fel bennem, hogy ezek az implementációk amikről beszélsz, ezek a core logikát is érintik? Vagy jellemzően mire vonatkoznak, hogy heti sprintekbe ilyen gyorsan ki lehet tolni őket?
Kovács Dominik Máté: – Nekünk kettő csapatunk van, az engineering, illetve a research. A research az egy havi sprintekben dolgozó csapat, nagyon lassan megy minden, ők kutatnak, általában az mindig elbukik, az is ugye haladás előre, és matematikával foglalkoznak. Az engineering és egy fejlesztői csapatnál gyakorlatilag heti sprintekben csináljuk azt, hogy átírjuk az egész termékünknek a kinézetét, teljesen új UI-t új design systemet rakunk be, ezt mind egy-két hét alatt meg tudjuk csinálni, hogy egyesével kirakjuk ezeket az újításokat. Core logikát is érinthet ez igen.
Nagy Géza: – Érthető. Ha nincsen több kérdés, akkor ezt a mai eseményt lezárjuk. Dominik, én még egyszer nagyon köszönöm, hogy itt voltál velünk. A videós téma kapcsán egy kis beharangozó információ a mi oldalunkról is, hogy a jövőben videós portálként fogjuk folytatni. Az előadóink, beszélgetőpartnereink továbbra is valódi emberek lesznek, de a piaci igényeket látva áttérünk a videós alapú működésre, így az utolsó élő eseményeinket márciusban találjátok meg e-commerce vonatkozásban. Itt is lesz data-vonal hogyha valaki e-commerce vonatkozásban is foglalkozna a témával. Data science módszerek a vásárlói viselkedésminták elemzésére”, ez egy korábbi eseményünknek a folytatása, és technológiai fókuszú lesz. Március 21-én lehet majd vele találkozni, de korábban, sőt már a holnapi nap ”Generációk és fogyasztói szokások változása a metaverzum kapujában” című eseményünk következik, és itt is meg fog jelenni maga a technológia. Március 10-én – ez már abszolút e-commerce fókusz – a Nestlé munkatársaival lehet találkozni, és „Online FMCG értékesítés a világ legnagyobb élelmiszeripari vállalatának szemszögéből” címmel szól majd az esemény, szeretettel várunk mindannyiótokat arra is. További szép napot kívánok mindenkinek, remélem élveztétek, és annyira hasznosnak találtátok az eseményt, mint mi.
Kovács Dominik Máté: – Köszönöm szépen a lehetőséget, mindenkinek szép napot!
CPO & Co-Founder, Colossyan
Dominik a Colossyan társalapítója és vezető termékfelelőse, a startup termékmenedzsmentjét és növekedési stratégiáját felügyeli. 2018 óta vezet tech startupokat, emellett Dániában és Németországban végzett startup akcelerátor programokat. Tucatnyi tech konferencián, workshopon és közösségi eseményen vett már részt, ahol betekintést adott a szintetikus média és az álhírek felderítésének jövőjébe.
Mesterséges intelligencia a videós kontent gyártásban | Publikus
Feltöltés dátuma : 2022. február 24.
Rugalmas és biztonságérzetet teremtő szervezet egy bizonytalan korban
2024. november 11.
NIS2: Térkép a kiberbiztonság-szabályozási aknamezőhöz
2024. november 04.
Az AI lehetséges irányai és kihívásai az aviatika iparágban
2024. október 25.
Hogyan tegyük AI adaptívvá a szervezetünket?
2024. október 18.
A jelen uralása az ipari termelésben
2024. október 11.
Digitális akadálymentesség szabályozás: Sok vállalatnak fog fájni!
2024. szeptember 27.
AI Has Entered The Chat; Humans, AI, and the Art of Collaboration
2024. augusztus 01.
The anatomy of autonomous driving projects
2024. július 25.
Iparvállalatok AI-osítása - Mapei esettanulmány interjú
2024. július 04.