Ihmiskunnan kehittyvä suhde tietokoneisiin

, johtaja Joshua Newnham Teknologi – Method London

(9. tammikuuta 2018)

Tässä viestissä keskustelemme suhteemme kehittymisestä laskennallisten kumppaniemme kanssa ja pyrimme ymmärtämään paremmin tunnetunnistustekniikoiden soveltamista.

kiinnostunut design ja tekoälyn risteyksestä altistaa sinut monille mielenkiintoisille konsepteille ja työkaluille, jotka näyttävät houkuttelevilta ja merkityksellisiltä ensi silmäyksellä, mutta vasta kun aloitat heidän kanssaan työskentelyn, alat kysyä syvällisempiä ja merkityksellisempiä kysymyksiä niiden soveltaminen ja arvo loppukäyttäjälle. Näin oli tunnetunnistustekniikoiden tapaan, kuten suosittu tunnetuntopalveluntarjoaja Affectiva , joka tarjoaa työkaluja käyttäjän tunteiden tunnistamiseen kuvan perusteella heidän kasvonsa.

Teknologina sinua kiinnostaa ensin miten ja se on vasta sinun jälkeensi miellyttää sen sisäisen toiminnan monimutkaisia ​​yksityiskohtia, että aloitat miksi. Vasta sen jälkeen, kun olen oppinut ja luonut järjestelmät, jotka kykenevät luokittelemaan tyydyttävästi tunteet, joissa on tekstiä tai kasvokuvaa, aloin kyseenalaistaa, miten niitä voitaisiin soveltaa. Vasta äskettäin olen ymmärtänyt niiden merkityksen ja sovellettavuuden; tämä oivallus on tämän viestin aloituspiste.

https://commons.wikimedia.org/wiki/File:Lutzmann\_Motorwagen.jpg

Uuden linssin tarve

Uutta tekniikkaa ei ole otettu käyttöön ilman mainintaa ”hevosettomasta vaunusta”; Don Normanin käyttämä termi kuvaillessaan uuden teknologian suunnittelun käyttöönottoa ja kehitystä. Siinä korostetaan, että me, suunnittelijat ja teknologit, yleensä heijastamme olemassa olevat henkiset mallimme uuteen teknologiaan, ja vasta monien toistojen jälkeen aloitamme uusien henkisten mallien luomisen, jotka soveltuvat paremmin tekniikkaan. Ilmeinen tarina, joka kuvaa tätä, on se, miten televisio-ohjelmat alun perin suunniteltiin ja lähetettiin; enimmäkseen huomiotta elementti, joka teki heistä rikkaamman kuin radio, joka oli kyky käyttää kuvien lisäämistä tarinan kuvaamiseen. Sen sijaan televisio-ohjelmat palasivat vain muuhun kuin radio-ohjelmaan, jossa oli esittäjien kuvia.

Huolimatta tietoisuudestani ja kiinnostuksestani affektiiviseen tietojenkäsittelyyn , se oli vaikea kuvitella tunteiden tunnistamisen käyttöä analytiikan ja raportoinnin ulkopuolella. Tietysti käsitteellisesti puhuisin usein siitä, että tietokone pystyy tunnistamaan käyttäjän tunteet ja vastaamaan niihin, mutta en kaivautunut paljon syvemmälle, koska en voinut nähdä, kuinka nykyiset sovelluksemme, kuten Microsoft Word, voisivat tehostaa sen käyttö – viime aikoihin asti. Mutta tämän ilmoituksen merkityksen ymmärtämiseksi ja ymmärtämiseksi on tärkeää ottaa askel taaksepäin ja tarkistaa, mitkä tietokoneet olivat, miten ne ovat kehittyneet ja niiden todennäköinen liikerata (suhteessa niiden sovelluksiin ja miten olemme vuorovaikutuksessa heidän kanssaan).

Lyhyt tietokoneen historia

Tietokonekonseptin suunnitteli 1800-luvulla englantilainen matematiikan professori nimeltä Charles Babbage ; tämä käsite nimettiin asianmukaisesti analyyttiseksi moottoriksi korostaen sen tarkoitusta suorittaa ja tuottaa matemaattisia laskelmia. Tämä konsepti toteutui lopulta noin 1943 ja sitä sovellettiin lentoradan laskemiseen sotilaallisiin tarkoituksiin. Käyttäjät olivat yleensä korkeasti koulutettuja ammattilaisia, jotka tekivät vuorovaikutusta tietokoneen kanssa käyttämällä kortteja, joissa on yksityiskohtaiset ohjeet tietokoneelle.

https://apple2history.org/history/ah16/

Seuraavaksi tulivat teollisuustietokoneet keskusyksiköiden muodossa; nämä, kuten International Business Machines (IBM), tuottivat, muistuttivat suurta osaa edeltäjistään ja vaativat jälleen korkeasti koulutettuja käyttäjiä käyttämään niitä, mutta korvaamalla fyysiset aukkoritinsä digitaalisella komentoriviliittymällä (CLI) ohjeidensa lähettämiseen.Tämän aikakauden aikana; ihmisen tietokone-vuorovaikutuksen (HCI) edistyminen on tunnustettava pienelle ryhmälle yksilöitä; henkilöt, kuten Steve Russell tykkäävät, jotka näkivät tietokoneita vain erälaskurin ulkopuolella ja kuvittelivat (ja loivat) interaktiivisia tietokoneohjelmia, jotka mahdollistivat tietokonepelien ensimmäisen aikakauden, kuten Kuten Spacewar! John McCarthy, jota pidetään tekoälyn isänä, kuvitteli ihmisille ja Doug Engelbartille tehtäviä suorittavien tietokoneiden potentiaali, joka paradoksaalisesti kuvitteli tietokoneita, jotka täydensivät meitä sen sijaan, että korvaavat meidät ja ovat edelläkävijöitä suurelle joukolle suoria suoria manipulointikäsitteitä, joita käytämme edelleen nykyään, mukaan lukien hiiri ja graafinen käyttöliittymä (GUI).

70-luvun lopulla näimme henkilökohtaisten tietokoneiden nousun; Nimestään huolimatta he eivät olleet kaukana henkilökohtaisista, mutta lopulta niistä tuli kohtuuhintaisia ​​ja sovellettavissa riittävän suurelle väestölle, jotta niitä voitaisiin pitää valtavirrana. Tappajasovellus oli tuolloin laskentataulukko, hienostunut toimiston tuottavuuden laskin. Käytettävyydestä ja omaksumisesta johtuen käytettävyys tuli pian erittäin tärkeäksi, ja komentojen antaminen päätelaitteen kautta oli este useimmille käyttäjille.

https://fi.wikipedia.org/wiki/Tiedosto:Apple\_Macintosh\_Desktop.png

Vasta 80-luvun alussa, GUI: n käyttöönoton jälkeen, vuorovaikutus tietokoneiden kanssa (hieman) demokratisoitui. Käyttöliittymässä käytettiin monia todellisesta maailmasta lainattuja metaforoja, tämä yhdessä suoran manipuloinnin ja nopean palautteen kanssa tekivät tietokoneista tietokoneasiantuntijoiden ulkopuolisen yleisön saataville. Tänä aikana näimme verkon lisääntymisen ja laajennettujen tietokoneiden sovellus- ja käyttötapaukset; Siirtyminen puhtaista analyyttisistä työkaluista sellaisiin tehtäviin kuten viestintä, viihde ja luova työ. Tämä hyväksyminen johti fyysisen maailmamme digitalisoinnin kiihtyvyyteen; tiedoista, viihteestä ja suhteistamme tuli tavuja.

Seuraava merkittävä virstanpylväs, joka vaikutti tietokoneiden käyttöön, oli 80-luvun puolivälissä ja Internetin lisääntyessä. sähköposti muutti tietokoneet viestintälaitteiksi; ihmiset eivät olleet vuorovaikutuksessa, ihmiset olivat vuorovaikutuksessa muiden ihmisten kanssa tietokoneiden kautta – tätä paradigmaa, joka kommunikoi ja tekee yhteistyötä tietokoneen kautta, kutsutaan nyt sosiaaliseksi tietojenkäsittelyksi.

https://www.pexels.com/photo/iphone-6-apple-hand-time-9041/

Sitten tuli iPhone (ja sitten Android); tietokoneista tuli lopulta todella henkilökohtaisia, kosketus pienensi käytön kitkaa entisestään ja antureiden lisääminen, liitettävyys ja edelleen lisääntynyt digitalisointi vahvistivat niiden merkitystä ja mukavuutta reaalimaailmassa ja ”todellisissa ihmisissä”. Mutta viime aikoihin asti he (tietokoneet) vaativat meitä edelleen nimenomaisesti opastamaan heitä ja kommunikoimaan staattisten rajapintojen kautta. Huolimatta siitä, että CLI: n abstraktiotaso on lisääntynyt, ydinvuorovaikutusmalli pysyi edelleen samana – tämä on nyt muuttumassa.

Olemme siirtymässä aikakauteen, jossa näemme keinotekoisen älykkyyden (AI) lähentymisen. ja älykkyyden lisääminen (IA) – jolloin meillä on järjestelmiä, jotka käyttävät älyä ymmärtääkseen paremmin meidät (ääni, kuvallinen, teksti tai ele), aikomuksemme ja pystymme suorittamaan tehtäviä puoliautomaattisesti ja joskus ennakoivasti.

https://www.jibo.com /

Jotta voin havainnollistaa tarkemmin, miten olemme vuorovaikutuksessa tietokoneiden kanssa, lainaan juonen osoitteesta Mark Billinghurst , tietokoneliittymien tutkija, joka korostaa etenemistämme kohti luonnollisia käyttöliittymiä ajan myötä.

Tämä juoni n Otamme vain esiin pienenevän kitkan meidän ja tietokoneidemme välillä (luonnolliset käyttöliittymät), mutta myös kuinka vuorovaikutuksemme siirtyvät eksplisiittisistä implisiittisiin eli yhä useammat järjestelmämme ovat ennakoivia.

Muita merkittäviä trendejä ovat sovellusten rooli ja tehtävä Siirtyminen puhtaiden, erillisten ohjeiden käsittelystä niihin, jotka käsittelevät suurta epäselvyyttä, ts. varhaisia ​​sovelluksia käytettiin ohjusreittien laskemiseen, kun taas nykyaikaiset sovellukset käsittelevät kappaleiden, elokuvien, kumppaneiden suosittelemista ja kokousten järjestämistä.Viimeinen suuntaus, jonka haluan korostaa, on se, kuinka tietokoneen muoto muuttuu näppäimistöstä ja näytöstä moniin muihin muotoihin, taskuissamme kannettavista kannettavista liuskekivistä älykkäisiin kaiuttimiin, jotka istuvat sängyn vieressä.

Edellä esitetyn tarkoituksena ei ole antaa kattavaa (tai tarkkaa) historiaopetusta laskennassa, vaan pikemminkin tuoda esiin, kuinka toiminta, muoto ja suhde tietokoneisiin on kehittynyt ajan myötä ja sen todennäköinen liikerata – siirtyminen puhtaasta toimiva työkalu läheiselle kumppanille. Joten kuten käyttöliittymä lainasi paljon fyysisestä maailmasta, jotta tietokoneiden välinen vuorovaikutus olisi tutumpaa ja luonnollisempaa, samoin tulee tunteen tunnistamisen, reagoinnin ja esittämisen tarve, toisin sanoen turhauttavaa on puhua älykkääksi pidetyn henkilön kanssa, jos se ei pysty tunnistamaan ja vastaamaan emotionaaliseen tilaan. Tunteiden esittäminen tarjoaa myös toisen tavan kommunikoida järjestelmän nykytilasta, mikä auttaa käyttäjää rakentamaan tarkemman ja hyödyllisemmän henkisen mallin järjestelmästä, johon he ovat vuorovaikutuksessa, eli sekaannuksen esittäminen voisi auttaa käyttäjää ymmärtämään, että järjestelmä tarvitsee apua .

Lyhyesti; Sen sijaan, että tunteita käytetään pelkästään analytiikkaan ja raportointiin, emotionaalisella älykkyydellä on paljon järkeä, kun puhut virtuaalisen henkilökohtaisen avun (VPA), digitaalisten avatarien tai fyysisesti ruumiillistettujen tietokoneiden, kuten robotin, kanssa. pohjimmiltaan milloin tahansa, kun olet tekemisissä tietokoneen kanssa, jonka kanssa voi olla luonnollisessa vuorovaikutuksessa, jolla on jonkin verran itsenäisyyttä, käsittele epäselvyyttä ja epävarmuutta, tunnet sinut ja mieltymyksesi ja vaatii luottamusta. Kuulostaa tutulta? Nämä piirteet ovat tyypillisesti rajoittuneet ihmisiin, mutta nyt myös laskennalliset kumppanimme ovat hankkineet nämä piirteet.

Tarkastellaan lyhyesti muutamia käyttötapauksia, joissa emotionaalinen äly on järkevää ja miten sitä voidaan käyttää.

Yksi esimerkki, joka kuvaa tätä muutosta laskennassa hyvin, on DragonBot ; MIT: n Sosiaalirobotiikkaryhmän tutkimusprojekti, jossa tutkitaan älykkäitä tutorointijärjestelmiä. DragonBot käyttää emotionaalista tietoisuutta sopeutuakseen opiskelijaan, esimerkiksi yksi sovelluksista on lukupeli, joka mukauttaa sanat tunnistetun tunteen perusteella eli järjestelmä voi säätää tehtävän vaikeutta (tässä tapauksessa sanoja) käyttäjien perusteella Tunnistetun tunteen määrittämä kyky.

Keskusteluagentit (chatbotit) ovat ilmeinen mahdollisuus tunnetunnistuksen käyttämiseen. Chatbotit suorittavat tällä hetkellä ns. Luonnollisen kielen ymmärtämisen (NLU) vastausten määrittämiseksi tämä vastaus on tyypillisesti riippuvainen annetusta -kontekstista ja päätelty intent mutta se ei ole pitkä (ja joitain on jo olemassa, kuten Emotibot ), ennen kuin siitä tulee vakio käyttää myös tunnustettua tunne määritettäessä vastausta käyttäjälle (kielen lisäksi myös äänen mukauttaminen vastaamiseksi). Tämä voi paitsi lisätä viestinnän tehokkuutta, myös antaa meille mahdollisuuden välttää epätoivotun käyttäytymisen syntymistä siinä, miten kommunikoimme keskenämme. Vitsimme studiossa usein siitä, kuinka ääniavustajat, kuten Alexa, luovat lapsille käyttäytymistä, jossa he vaativat asioita pikemminkin kuin pyytävät heiltä ”Alexa Kerro minulle aika!”.

Keskustelurajapinnoina siitä tulee tarve kehittää tehokkaampia tapoja tunnistaa ja mukautua käyttäjien tunteet, erityisesti lääketieteellisen avun ( Ada ) ja mielenterveyden aloilla. terveys ( woebot ).

Yleensä emotionaalista tunnistusta voidaan käyttää joko lisääntymiseen sitoutuminen tai mukauttaa automaattisesti käyttäjilleen; Disney Research tarjoaa monia muita esimerkkejä siitä, missä emotionaalisella tunnustamisella on merkitystä sisällön mukauttamisessa. heidän etsinnöistään interaktiivisissa esiopetuksen televisio-ohjelmissa , heidän vuorovaikutteisessa kertomuksen kirjoitustyökalussa ja monissa muissa – Kehotan teitä viettämään jonkin aikaa tutkimiseen.

Kuten edellä mainittiin; tämän tutkimuksen katalysaattori johtui alun perin uteliaisuudestani halusta tietää, kuinka tunnistaa tunteet, mikä itse johtui aloitteesta täällä -menetelmässä nimeltä FINE.

FINE on ekosysteemi, joka on suunniteltu tukemaan pienten lasten mielenterveyttä. Tunteet ovat hyvin ytimessä – sekä syötteen että ulostulon suhteen.Vaikka kamera ja näppäimistö, seuraamme ja päätelemme käyttäjän (käyttäjien) emotionaalista tilaa ja tämän tiedon avulla esitämme sitten yhdistetyn tunnelman jaetun laitteen kautta. Tämä kannustaa kommunikoimaan sekä tarjoamaan empaattisen kumppanin virtuaalisen avatarin kautta, joka opetti empatiaa väkijoukon hankkimalla älyllä.

Tunteiden tunnistamisen soveltaminen on hyvin aluekohtaista, mutta toivon, että olen esittänyt yllä riittävän vahvan perustelun sen mahdollisuudesta ja todennäköisyydestä adoptioon tulevina vuosina. Tunnustus on toisaalta yleismaailmallinen, ja siksi vietän loppuosan tästä viestistä lyhyesti ja yhteenvetona lähestymistavoista, joita FINE käytti käyttäjän tunteiden päättelemiseen käyttämällä sekä kasvokuvaa että kirjoittamaansa tekstiä.

Tunteiden tunnistaminen ilmeistämme

Nopea haku Googlesta siitä, mikä prosenttiosuus viestinnästä tapahtuu kehon kielen kautta, korostaa nopeasti, että suurin osa viestinnästä on sanatonta (kehon kieli vastaa 55\% koko viestistä) , äänen osuus on 38\% ja sanojen osuus vain 7\%). Joten ei pitäisi olla yllätys, että paljon voidaan päätellä yksinkertaisesti katsomalla kasvojaan – tämä on lähtökohta sille, että voimme päätellä jonkun tunteen yksinkertaisesti tutkimalla heidän kasvonilmeään. Joten tehtävä kuuluu nyt luokittelemaan kasvojen ilmeet tunteiden määrittämiseksi, ja onneksi sitä on tutkittu hyvin ja tiedot ovat saatavilla.

Luokittelijamme koulutuksessa käytetty tietojoukko on peräisin Kaggle-kilpailu ; mukana oleva tietojoukko koostuu yli 20000 harmaasävykuvasta kasvoista, jotka on manuaalisesti merkitty joko vihaisiksi , inho , pelko , onnellinen , surullinen , yllätys tai neutraali . Kuten minkä tahansa koneoppimisen (ML) projektissa; Ensimmäinen tehtävämme on rakentaa intuitio tietojen ympärille ja keksiä joitain teoreettisia hypoteeseja siitä, miten luokittelu suoritetaan. Alla on joitain esimerkkejä tietojoukkomme kasvoista ja niihin liittyvistä tunnisteista.

Oletuksemme on, että ilmaisun ja tunteen välillä on jokin yleinen malli; yksi tapa tutkia ja vahvistaa tätä on visualisointi. Sen visualisoimiseksi voimme ottaa jokaisen tunteen keskimääräiset kasvot; alla näytämme miltä tämä näyttää tunteilta vihainen , onnellinen ja yllätti .

Voimme selvästi nähdä, että jokaisella näistä tunteista on erilliset ilmaisut; seuraava tehtävämme on oppia nämä mallit. Tässä kokeessa käytimme Convolution Neural Network (tai ConvNet) näiden mallien oppimiseen (hylkäämme yksityiskohdat täällä, mutta jaamme Muistikirjan niille, jotka ovat kiinnostuneita tietämään tekniset yksityiskohdat). 15 koulutusjakson jälkeen saavutimme validointitarkkuuden lähellä 60\% (ei huono, koska lähtötaso olisi noin 14\%); alla esitetyt harjoittelutulokset.

Tunteiden tunnistaminen tekstistä

Näimme ennen, että teksti (käyttämämme sanat) edustaa vain 7\% koko viestistä; tämä ja se, että kielet perivät epäselvyyden, tekevät siitä vaikeamman, mutta silti arvokkaan tietolähteen ja jotain, jota voidaan helposti valvoa passiivisesti. Tätä prototyyppiä varten koulutimme toistuvan hermoverkon (jätämme jälleen kerran yksityiskohdat täältä, mutta jaamme Muistikirjan niille, jotka ovat kiinnostuneita teknisistä yksityiskohdista) ja siirsi sen (malli) CoreML , Apple-ML-kehykseen. Tämän mukana oli mukautettu iOS-näppäimistö, joka seurasi passiivisesti käyttäjän kirjoittamia tietoja ja käytti tätä mallia käyttäjän nykyisen emotionaalisen tilan määrittämiseen.

Tekstin tietoja oli vaikea löytää; vaikkakin muutamia luotettavista lähteistä, yksikään ei sisältänyt huomattavaa määrää esimerkkejä syvän hermoverkon kouluttamiseksi. Tässä on tärkeä asia; merkitty tieto on pelottavaa ja sen hankkiminen voi olla kallista.Erilaisia ​​aineistoja kokeiltiin sen jälkeen, kun ne oli lopulta ratkaistu tietojoukolla, jonka CrowdFlower on toimittanut. Aineisto koostuu noin 40 000 rivistä twiittejä, jotka on merkitty yhdellä 13 tunteesta ( kuten onnellisuus, suru ja viha). Yksi tietojoukon kysymys oli kunkin tunteen esimerkkien epätasapaino. Alla oleva juoni näyttää tämän jakauman. Tästä huolimatta tavoitteemme oli toteutettavuus ja soveltaminen pikemminkin kuin tarkkuus, joten jatkoimme tämän tietojoukon kanssa.

Huolimatta merkittävästä epätasapainosta ja harjoitteluesimerkkien määrästä, pystyimme silti saamaan noin 35\%: n validointitarkkuuden 12 ajanjakson jälkeen.

Alla näkyy laitteelle suoritettava luokitus (vaikkakin simulaattori tässä tapauksessa ).

Täällä olemme vain tutkineet ilmeiset käytettävissä olevat lähteet tunteiden tunnistamiseksi; toiset sisältävät sävyn (äänensävyn), käyttäytymiseen (tai malliin perustuvan) ja poseeraa, mutta tärkeä asia, joka on poistettava, on suuntaus nimenomaisesta implisiittiseen vuorovaikutukseen ja kuinka tunne on arvokas panos sen määrittämiseksi, miten järjestelmäsi toimii käyttäjä.

Ihmisen tietokoneiden vuorovaikutuksesta (HCI) ihmisen tietokonesuhteisiin (HCR)

Päätämme tämän viestin korostamalla jälleen HCI: n evoluutiota ja suhteemme merkitystä. tietokoneiden kanssa on tulossa yhtä tärkeä asia kuin kuinka olemme tekemisissä heidän kanssaan.

HCI: n alkuperäinen painopiste oli käytettävyyden käsitteessä. Jos käytettävyyden alkuperäinen määritelmä keskittyi yksinomaan yksinkertaisuuden käsitteeseen, ts. ”helppo oppia, helppo käyttää”, se on jatkuvasti kehittynyt tekniikan kehityksen rinnalla. Se vaatii nyt hauskuuden, hyvinvoinnin, kollektiivisen tehokkuuden, esteettisen jännityksen, lisääntyneen luovuuden, virtauksen, tuen inhimilliselle kehitykselle ja muille.

Se on siirtynyt työpöydällä istuvan käyttäjän ulkopuolelle ja teknologian mahdollistamat uudet rajat. Tämä riippuvuus tekniikasta tarkoittaa jatkuvasti tutkittavaa, kehitettävää ja hyödynnettävissä olevaa uutta aluetta mahdollisuuksista parantaa ihmisen toimintaa ja kokemusta. Nämä tekniikat tarjoavat nyt mahdollisuuden tunnistaa käyttäjän tunteet; mitä teet tämän kanssa?

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *