AI-tietokartta: kuinka luokitella AI-tekniikat

Luonnos uudesta AI-tekniikkamaisemasta

Tämän artikkelin lyhyempi versio ilmestyi ensin Forbesille

Artikkeli on palkittu myös KDnuggetsin hopeamerkillä, joka on yksi luketuimmista ja jaettavista elokuussa 2018.

I. Johdanto-ajatukset

Olen ollut jonkin aikaa keinotekoisen älyn tilassa ja tiedän, että olemassa on useita luokituksia, erotuksia, maisemia ja infografioita edustamaan ja seuraamaan erilaisia ​​tapoja ajatella AI: tä. En kuitenkaan ole suuri luokitteluharjoitusten fani, lähinnä siksi, että luulen, että pyrkimys luokitella dynaamiset datapisteet ennalta määrättyihin korjauslaatikoihin ei usein ole sellaisen "selkeän" kehyksen etujen arvoista (se on yleistäminen) tietysti, koska joskus ne ovat erittäin hyödyllisiä).

Kun kyse on erityisesti tekoälystä, uskon myös, että monet siellä olevista luokituksista ovat joko puutteellisia tai eivät pysty vangitsemaan tämän uuden AI-aallon vahvoja perustavanlaatuisia yhteyksiä ja näkökohtia.

Joten saanen ensin kertoa sinulle tämän viestin perusteet. Yhteistyössä strategisen innovaatiotoimiston Chôran kanssa halusimme luoda visuaalisen työkalun, jonka avulla ihmiset ymmärtävät yhdellä silmäyksellä tämän työkalupakin monimutkaisuuden ja syvyyden, sekä laatia kartan, joka voisi auttaa ihmisiä suunnistumaan AI-viidakossa. Sinun tulisi tarkastella seuraavaa kuvaajaa keinona organisoida jäsentämätön tieto eräänlaiseksi ontologiaksi, jonka lopullisena tavoitteena ei ole edustaa tarkasti kaikkia olemassa olevia tietoja AI: stä, vaan pikemminkin työkalua kuvaamaan ja käyttämään osaa tästä tietojoukosta.

Seuraavaksi pyritään sitten piirtämään arkkitehtuuri pääsemään tietoon AI: stä ja seuraamaan nousevaa dynamiikkaa. Yhdyskäytävä aiheeseen liittyvästä olemassa olevasta tiedosta, jonka avulla voit etsiä lisätietoja ja lopulta luoda uutta tietoa AI: stä.

Lopputyön hyödyllisyyden pitäisi siis auttaa sinua saavuttamaan kolme asiaa: ymmärtämään meneillään olevaa asiaa ja omistamaan kartta polun seuraamiseksi; ymmärtää, missä koneintelaa käytetään nykyään (suhteessa mihin aiemmin ei käytetty); ymmärrys siitä, mitä ja kuinka monta ongelmaa kehitetään uudelleen, jotta AI: lla on mahdollisuus puuttua niihin (jos olet perehtynyt Agrawalin ym. työhön, 2018 nämä ovat välittömiä seurauksia ennustetekniikan kustannusten laskusta).

Tämä artikkeli kohdistuu periaatteessa sekä AI: ssä aloittaviin ihmisiin antaakseen heille laajan käsityksen siitä, mitä siellä tapahtuu, että myös asiantuntijoille ja ammattilaisille, jotka kokeilevat tätä tekniikkaa jonkin aikaa (pyynnöstä lähettää minulle palautetta siitä, kuinka rakentaisit sen tai muun tekniikan, jonka tulisi olla AI-spektrin kaapattava).

Tiedän myös erittäin hyvin, että tämä on kunnianhimoinen tehtävä, joten katsokaa tätä vain ensimmäiseksi luonnokseksi tai yritykseksi tehdä se sen sijaan, että lopulliseksi rakennettaisiin kiveen.

Saanen myös päättää tämän johdannon jollain, jonka huomasin yrittävänni saavuttaa tämän visuaalisen luomisen tavoite: se on erittäin, erittäin vaikea. Yritetty edustaa mahdollisimman paljon tietoa kaksiulotteisessa ei-ilmeisessä kartassa on ollut erittäin haastavaa, jota et ymmärrä ennen kuin yrität tehdä sen itse. Kutsun teitä kaikkia tekemään samoin ymmärtääksesi mitä tarkoitan (uskokaa minua, se ei ole ollenkaan helppoa, etenkin kun otetaan huomioon mielipiteiden, näkökulmien ja lähestymistapojen ristiriidat AI: ssä viimeisen 60 vuoden aikana). Tämä vie minut lopulliseen vastuuvapauslausekkeeseen: joskus minun oli lähestyttävä käsitteitä tai itse luokitusta, jotta voin ylläpitää kompromissia tarkkuuden ja selkeyden välillä, joten anna minulle anteeksi jo joillekin pienille (tai suurille jonkun silmälle) virheellisiä tietoja.

Joten siirrytään nyt AI-tietokarttaan (AIKM).

II. Ongelmaalue + lähestymistapa = Teknologinen ratkaisu

Joten tässä mennään, siinä se on. Odotit todennäköisesti ottaen käyttöön markkinoille omituisen VR-moottorin, joka projisoi useita valon kimppuja kutakin tekniikkaa varten, mutta se on sen sijaan vanhanaikainen kaksidimensionaalinen kuvaaja. Niin yksinkertaista.

Katsotaanpa sitä kuitenkin hieman lähemmin.

Akseleilta löydät kaksi makroryhmää, ts. AI-paradigmat ja AI-ongelmaalueet. AI-paradigmat (X-akseli) ovat todella lähestymistapoja, joita AI-tutkijat käyttävät erityisten AI: hen liittyvien ongelmien ratkaisemiseksi (se sisältää lähestymistavat, jotka olemme tietoisia ajan tasalla). Toisaalta AI-ongelmaalueet (Y-akseli) ovat historiallisesti tyyppejä, joita AI voi ratkaista. Jossakin mielessä se osoittaa myös AI-tekniikan potentiaaliset kyvyt.

Olen siis tunnistanut seuraavat AI-paradigmat:

  • Loogiset työkalut: työkalut, joita käytetään tiedon esittämiseen ja ongelmien ratkaisemiseen;
  • Tietopohjaiset työkalut: ontologioihin ja valtaviin käsitteisiin, tietoihin ja sääntöihin perustuviin tietokantoihin perustuvat työkalut;
  • Todennäköisyysmenetelmät: välineet, joiden avulla edustajat voivat toimia puutteellisissa informaatioskenaarioissa;
  • Koneoppiminen: työkalut, joiden avulla tietokoneet voivat oppia datasta;
  • Sulautettu älykkyys: tekniikan työkalupakki, jossa oletetaan, että korkeaa älykkyyttä varten tarvitaan runko (tai ainakin osittainen toimintojen joukko, kuten liike, havainto, vuorovaikutus ja visualisointi);
  • Haku ja optimointi: työkalut, jotka mahdollistavat älykkään haun monien mahdollisten ratkaisujen avulla.

Nämä kuusi paradigmaa jakautuvat myös kolmeen erilaiseen makro-lähestymistapaan, nimittäin symboliseen, alisymboliseen ja tilastolliseen (edustavat eri värit). Lyhyesti sanottuna symbolisessa lähestymistavassa todetaan, että ihmisen älykkyys voitaisiin pelkistää symbolikäsittelyyn; alasymboliseen lähestymistapaan, jonka mukaan mitään erityisiä tiedon esityksiä ei pitäisi antaa etukäteen, kun taas tilastollinen lähestymistapa perustuu matemaattisiin työkaluihin tiettyjen alaongelmien ratkaisemiseksi.

Nopea lisähuomautus: saatat kuulla ihmisten puhuvan ”AI-heimoista”, Pedro Domingosin (2015) ehdottamasta konseptista, joka ryhmittelee tutkijoita ryhmiin perustuen lähestymistapoihin, joita he käyttävät ongelmien ratkaisemiseksi. Voit helposti kartoittaa nämä viisi heimoa paradigmaluokituksemme avulla (ottamatta huomioon kehitettyä älyryhmää), ts. Symbolistit logiikkapohjaisella lähestymistavalla (he käyttävät loogisia päättelyjä, jotka perustuvat abstrakteisiin symboleihin); Koneoppimisen yhteyshenkilöt (heidän inspiroijana on nisäkkään aivot); Evolutionaarit, jotka etsivät ja optimoivat (ne ovat inspiroituneet darwilaisen evoluution perusteella); Bayesiläiset todennäköisyysmenetelmillä (he käyttävät todennäköisyyden mallintamista); ja lopuksi analyytikoita tietopohjaisilla menetelmillä, koska he yrittävät ekstrapoloida olemassa olevaa tietoa ja aiempia vastaavia tapauksia.

Pystyakseli asettaa sen sijaan ongelmat, joihin AI on käytetty, ja luokittelu tässä on melko vakio:

  • Perustelu: kyky ratkaista ongelmia;
  • Tieto: kyky edustaa ja ymmärtää maailmaa;
  • Suunnittelu: kyky asettaa ja saavuttaa tavoitteita;
  • Viestintä: kyky ymmärtää kieltä ja kommunikoida;
  • Havainto: kyky muuttaa raa'at sensuuritulot (esim. Kuvat, äänet jne.) Käyttökelpoisiksi tiedoiksi.

Kysyn edelleen itseltäni, onko tämä luokittelu riittävän suuri kattamaan kaikki tällä hetkellä kohtaamamme ongelmavalikoimat vai olisiko lisättävä uusia tapauksia (esim. Luovuus tai liike). Toistaiseksi pidän kuitenkin kiinni 5-klusterista.

Sen sijaan laatikoiden kuviot jakavat tekniikat kahteen ryhmään, ts. Kapeisiin sovelluksiin ja yleisiin sovelluksiin. Käytetyt sanat ovat tarkoituksella hiukan harhaanjohtavia, mutta kantavat minua sekunnin ajan ja selitän mitä tarkoitin. Kaikille, jotka aloittavat AI: stä, on ensiarvoisen tärkeää tietää ero heikko / kapea AI (ANI), vahva / yleinen AI (AGI) ja keinotekoinen superäly (ASI) välillä. Selvyyden vuoksi ASI on yksinkertaisesti ajan tasalla oleva spekulointi, Yleinen AI on tutkijoiden lopullinen tavoite ja pyhä graali, kun taas kapea AI on se, mitä meillä todella on tänään, eli sarja teknologioita, jotka eivät pysty selviytymään mistään niiden soveltamisalan ulkopuolella (mikä on tärkein ero AGI: n kanssa).

Kaaviossa käytetyt kaksi rivityyppiä (jatkuva ja pisteviiva) haluavat sitten osoittaa nimenomaisesti eron ja tehdä sinusta vakuuttuneena siitä, että kun luet jotain muuta johdanto-osan AI-materiaalia, et eksy kokonaan. Samanaikaisesti erotus tässä hahmottaa kuitenkin tekniikoita, jotka voivat ratkaista vain tietyn tehtävän (yleensä paremmin kuin ihmiset - kapeat sovellukset), ja sellaisia, jotka nykyään tai tulevaisuudessa voivat ratkaista useita tehtäviä ja olla vuorovaikutuksessa maailman kanssa (paremmin kuin monet ihmiset - Yleiset sovellukset).

Katsotaan lopuksi, mitä itse kaaviossa on. Kartassa esitetään AI-tekniikoiden eri luokat. Huomaa, etten tarkoituksellisesti nimeä tiettyjä algoritmeja, vaan ryhmitän ne pikemminkin makroryhmiin. En myöskään tarjoa sinulle arvoarviointia siitä, mikä se toimii ja mikä ei, vaan luettelon siitä, mitä tutkijat ja tietotieteilijät voivat käyttää.

Joten miten luet ja tulkitset karttaa? No, anna minun antaa sinulle kaksi esimerkkiä auttaa sinua tekemään sen. Jos tarkastellaan luonnollisen kielen prosessointia, tämä upottaa algoritmit, jotka käyttävät tietopohjaisen lähestymistavan, koneoppimisen ja todennäköisyysmenetelmien yhdistelmää havaintoalueen ongelmien ratkaisemiseksi. Samanaikaisesti, jos tarkastellaan tyhjää tilaa logiikkapohjaisen paradigman ja perusteluongelmien risteyksessä, saatat ihmetellä, miksi siellä ei ole tekniikoita. Kartta välittää sitä, että siinä ei ole kategorisesti olemassa menetelmää, joka voi täyttää kyseisen tilan, vaan pikemminkin, että kun ihmiset lähestyvät päättelyongelmaa, he mieluummin käyttävät esimerkiksi koneoppimismenetelmää.

Tämän selityksen päätteeksi tämä on täydellinen luettelo tekniikoista, joihin sisältyy omat määritelmät:

  • Robottiprosessin automaatio (RPA): tekniikka, joka purkaa luettelon suoritettavista säännöistä ja toimista tarkkailemalla tietyn tehtävän suorittavaa käyttäjää;
  • Asiantuntijajärjestelmät: tietokoneohjelma, jolla on koodatut säännöt jäljitellä ihmisen päätöksentekoprosessia. Sumuiset järjestelmät ovat erityinen esimerkki sääntöpohjaisista järjestelmistä, jotka kartoittavat muuttujat arvojen jatkuvuudeksi välillä 0 - 1, toisin kuin perinteinen digitaalinen logiikka, joka johtaa tulokseen 0/1;
  • Tietokonenäkö (CV): menetelmät digitaalisten kuvien hankkimiseksi ja ymmärtämiseksi (jakautuvat yleensä toiminnan tunnistukseen, kuvien tunnistamiseen ja konenäköön);
  • Luonnollisen kielen käsittely (NLP): alakenttä, joka käsittelee luonnollisen kielen tietoja (tähän kenttään kuuluvat kolme päälohkoa, ts. Kielen ymmärtäminen, kielen luominen ja konekäännös);
  • Neuraaliverkot (NN: t tai ANN: t): Algoritmit, jotka on mallinnettu löysästi ihmisen / eläimen aivojen hermostorakenteen perusteella ja jotka parantavat sen suorituskykyä ilman, että heille annetaan nimenomaista opastusta siihen. NN: n kaksi suurta osaa ja tunnettu alaluokka ovat syväoppiminen (neuroverkko, jossa on useita kerroksia) ja generatiiviset kilpailevat verkot (GAN - kaksi verkkoa, jotka kouluttavat toisiaan);
  • Autonomiset järjestelmät: osakenttä, joka sijaitsee robottiikan ja älykkäiden järjestelmien välillä (esim. Älykäs havainto, taitavien esineiden käsittely, suunnitelmapohjainen robotin hallinta jne.);
  • Hajautettu keinotekoinen äly (DAI): luokka tekniikoita, jotka ratkaisevat ongelmat jakamalla ne itsenäisille "edustajille", jotka ovat vuorovaikutuksessa keskenään. Moniagenttijärjestelmät (MAS), agenttipohjainen mallintaminen (ABM) ja Swarm Intelligence ovat tämän alajoukon kolme hyödyllistä eritelmää, joissa kollektiivinen käyttäytyminen syntyy hajautettujen itseorganisoitujen agenttien vuorovaikutuksesta;
  • Vaikuttava laskenta: alakenttä, joka käsittelee tunteiden tunnistamista, tulkintaa ja simulointia;
  • Evoluutioalgoritmit (EA): se on osa laajempaa tietotekniikan aluetta, nimeltään evoluutiolaskenta, joka käyttää biologian inspiroimia mekanismeja (esim. Mutaatio, lisääntyminen jne.) Etsimään optimaalisia ratkaisuja. Geneettiset algoritmit ovat käytetyimpiä EA-ryhmien alaryhmiä, jotka ovat hakuheuristiikkoja, jotka seuraavat luonnollista valintaprosessia valitakseen "sopivimman" ehdokasratkaisun;
  • Induktiivinen logiikkaohjelmointi (ILP): alakenttä, joka käyttää muodollista logiikkaa edustamaan tietokantaa tosiasioista ja muotoamaan näistä tiedoista johtuva hypoteesi;
  • Päätösverkot: on yleistä tunnetuimmista Bayesin verkoista / päätelmistä, jotka edustavat muuttujien joukkoa ja niiden todennäköisyyssuhteita kartan kautta (kutsutaan myös suunnattuksi asykliseksi kuvaajaksi);
  • Todennäköinen ohjelmointi: kehys, joka ei pakota sinua koodaamaan tiettyä muuttujaa, vaan toimii todennäköisyysmalleilla. Bayesian Program Synthesis (BPS) on jotenkin todennäköisyysohjelmoinnin muoto, jossa Bayesin ohjelmat kirjoittavat uusia Bayesin ohjelmia (ihmisten sijaan tekevät sitä, kuten laajemmassa todennäköisyysohjelmointimenetelmässä);
  • Ambient Intelligence (AmI): kehys, joka vaatii fyysisiä laitteita digitaaliseen ympäristöön, jotta he havaitsevat, havaitsevat ja vastaavat asiayhteydetietoisesti ulkoiseen ärsykkeeseen (jonka yleensä laukaisee ihmisen toiminta).

Tiettyjen ongelmien ratkaisemiseksi saatat noudattaa yhtä tai useampaa lähestymistapaa, mikä puolestaan ​​tarkoittaa yhtä tai useampaa tekniikkaa, koska monet niistä eivät ole lainkaan toisiaan poissulkevia, vaan toisiaan täydentäviä.

Lopuksi, on olemassa toinen asiaankuuluva luokittelu, jota en ole upottanut yllä olevaan kaavioon (ts. Erityyppinen analytiikka), mutta se on syytä mainita täydellisyyden vuoksi. Saatat tosiasiallisesti kohdata viisi erillistä analyysityyppiä: kuvaava analytiikka (mitä tapahtui); diagnostinen analytiikka (miksi jotain tapahtui); ennustava analytiikka (mitä tapahtuu); reseptilääkkeet (suosittelevat toimenpiteet); ja automatisoitu analytiikka (toimien suorittaminen automaattisesti). Saatat myös olla houkutus käyttää sitä luokittelemaan jollain tavalla yllä olevat tekniikat, mutta todellisuus on, että kyseessä on funktionaalinen luokittelu ja prosessiluokka eikä tuoteluokka - toisin sanoen jokainen spektrin tekniikka voi suorittaa nämä viisi analysointitoimintoa. .

III. johtopäätös

Tietokoneiden opettaminen ilman erillistä ohjelmointia on vaikea tehtävä, johon sisältyy useita tekniikoita käsittelemään useita vivahteita, ja vaikka tämä kartta ei olekaan kaukana täydellisestä, se on ainakin ensimmäinen yritys ymmärtää sotkuinen maisema kuin tekoäly on.

Olen täysin tietoinen siitä, että täällä syntyy vahva Pareto-periaate, ts. Että 80% (ellei enemmän) nykyisistä ponnisteluista ja tuloksista perustuu 20%: lla kartassa esitetyistä tekniikoista (nimittäin syväoppiminen, NLP ja tietokone) visio), mutta olen myös varma, että koko kirjo voi auttaa tutkijoita, startup-yrityksiä ja sijoittajia.

Sen lisäksi, että yritän upottaa ja pohtia palautetta ja kommentteja tästä ensimmäisestä versiosta, aion jatkossakin tehdä kaksi lisävaihetta: yksi on luoda kerros tyyppisille haasteille, joita AI kohtaa (esim. Muistikysymykset ja katastrofaalinen unohtaminen, siirrä oppiminen, oppiminen harvemmasta tiedosta esimerkiksi nolla- ja yksisuuntaiseen oppimiseen jne.) ja mitä tekniikkaa voidaan käyttää kyseisen ongelman ratkaisemiseksi. Toiseksi yritetään käyttää linssejä tarkastelemaan erilaisia ​​tekniikoita eikä ratkaisemiinsa ongelmiin vaan niiden luomiin ongelmiin (esim. Eettiset kysymykset, tietointensiiviset ongelmat, musta laatikko ja selitettävyysongelma jne.).

Jos sinulla on kommentteja nykyisen työn parantamiseksi tai ehdotuksia näiden kahden lisävaiheen upottamiseksi, ota yhteyttä!

Ja jos olet yritys, joka työskentelee jonkin edellä mainitun tekniikan kanssa, haluaisin kuulla sinusta enemmän.

Ilmoittaminen: AI-tietokartta kehitettiin strategisella innovaatiokonsultoinnilla Axilolla, joka toimii heidän Chôra-alustallaan.

Viitteet

Agrawal, A., Gans, J., Goldfarb, A. (2018). ”Ennustamiskoneet: keinotekoisen älykkyyden yksinkertainen talous”. Harvard Business Review Press.

Domingos, P. (2015). "Pääalgoritmi: Kuinka pyrkimys lopulliseen oppikoneeseen muuttaa maailmaa". New York: Peruskirjat.