Blog

Poden pensar les màquines?

02/07/2019, Written by 0 comment

El títol d’aquest article és en realitat part de la frase amb què comença l’article d’Alan Turing titulat ‘Computing Machinery and Intelligence’1, publicat el 1950. La frase completa era’ Proposo considerar la pregunta, poden pensar les màquines? ‘col·locada sota l’epígraf’ el joc d’imitació ‘, que, com ja haurà endevinat el lector, condueix al conegut’ Test de Turing ‘, important precursor de la disciplina coneguda com a’ Intel·ligència Artificial ‘(iA).

Avui dia s’estan popularitzant termes com computació cognitiva, xarxes neuronals i aprenentatge profund -‘deep learning’-, tots ells conceptes relacionats amb la IA, dels quals quals es porta parlant ja des de mitjans del passat segle XX.

Però no és fins a mitjans de la primera dècada d’aquest segle XXI quan es produeix un enlairament de l’anomenat ‘aprenentatge de les màquines’ amb uns resultats i unes possibilitats que ara mateix no arribem a veure.

Han començat a proliferar aplicacions i eines basades en aquests models de computació, que són els de l’aprenentatge de les màquines o ‘aprenentatge profund’, o eines de simulació per fer prediccions amb multitud de dades recollides de situacions semblants, amb els quals les màquines aprenen .

Tant és així, que els productes que comencen a sortir al mercat, sembla que han de portar alguna etiqueta fent referència a la IA, com ‘reconeixement del llenguatge natural’, ‘computació cognitiva’, ‘aprenentatge de la màquina’, etc.

Empreses com Google, Facebook, Apple, IBM, Salesforce, Cisco, etc. estan immerses en investigació d’eines i plataformes que utilitzin algoritmes de ‘aprenentatge de les màquines’. En ciberseguretat s’està considerant com una potent ajuda a la quantitat de ciberamenaces a què s’enfronten les organitzacions.

foto

En paraules de Jense Huang, CEO de Nvidia, “El programari s’està menjant el món, però la IA va a menjar-se el programari« 2.

De la mateixa manera, les empreses consumidores demanen, també, aquests productes com a solució als seus problemes.

¿Però és necessari utilitzar per a qualsevol tasca aquest tipus d’eines? O potser caldria parar-se a pensar quina eina és necessària per a la tasca concreta independentment que porti l’etiqueta d’IA o no?

El desembre de l’any passat 2016, el CISR de la MITSloan en un dels seus ‘Research Briefing’ titulat ‘Cinc coses que has de conèixer de la computació Cognitiva’3 publicar dades d’un estudi sobre aquest tema basant-se entrevistes realitzades a líders del negoci i de tecnologia de trenta-tres empreses.

De l’estudi es desprèn que, d’una banda, no hi ha solucions immediates a les incerteses d’avui, i per una altra, les solucions no són universals, ni per a tots els problemes i tasques, ni per a totes les empreses. Abans d’implementar solucions IA, s’han de conèixer molt bé les regles del negoci.

Les Tecnologies de la Informació són eines, molt potents sens dubte, i que han canviat i segueixen canviant el món, però eines, al cap ia la fi, que cal saber on, per què i com utilitzar.

Però comencem amb …

Una mica de història

El famós ‘Test d’intel·ligència’ proposat per Alan Turing en 1950, ja esmentat, consistia que un humà avalués converses en llenguatge natural entre altre humà i una màquina dissenyada per a generar respostes similars a les d’un humà. Es podria qualificar de ‘intel·ligent’ a la màquina si l’humà que avaluava a banda i participants no sabés distingir-los.

Uns anys després, el 1955, John McCarthy (Dartmouth College), Marvin Minsky (Harvard University), Nathan Rochester (I.B.M. Corporation) i Claude Shannon (Bell Telephone Laboratories) van convocar a un grup d’investigadors per a una reunió al Dartmouth College.

A la proposta de temes a tractar que van fer per a la cimera, van aparèixer termes com processament del llenguatge natural, xarxes neuronals ( ‘Neural Nets’ o NN), aprenentatge i ‘auto-millora’ (self-improvement) de les màquines, entre d’altres .

L’aprenentatge de les màquines es describía com un mecanisme amb canals d’entrada i sortida, així com d’un mitjà -algoritmos matemàtics- per donar una varietat de respostes de tal manera que la màquina pogués ser entrenada per un procés de ‘prova i error’ per escollir una d’entre una varietat de funcions de ‘entrada-sortida’.

En essència, això és el que fan les xarxes neuronals, “que consisteixen de molts processadors senzills connectats, anomenats neurones, cadascun produint una seqüència d’activacions de valors reals. Les neurones ‘input’ s’activen a través de sensors que perceben l’entorn, altres neurones s’activen a través de connexions ponderades (donant pesos als diferents dades, de forma anàloga a la importància que es dóna als diferents factors quan es prenen decisions ) procedents de neurones ja actives «6. Són algoritmes i models estadístics.

La reunió de Dartmouth, efectivament, tindria lloc en l’estiu de l’any següent, 1956, i entre la vintena de participants, inclosos els signants de la convocatòria, es van reunir tres premis Nobel i quatre premis Turing7.

Va ser en aquesta Conferència de Dartmouth ( ‘The Dartmouth Summer Research Project on Artificial Intelligence’) on quedaria encunyat oficialment el terme Intel·ligència Artificial.

El nou concepte es va definir com ‘la ciència i l’enginyeria per fer màquines intel·ligents, particularment programes d’ordinadors intel·ligents’, entesa aquesta intel·ligència com ‘la part computacional de la capacitat per aconseguir objectius al món’.

Els algoritmes i models matemàtics relacionats amb les NN han evolucionat des dels anys 40 del passat segle, d’unes quantes etapes de computació en resposta a unes quantes capes de NN (Shallow NN), a algoritmes desenvolupats entre els anys 60 a 80 per als models lògics de NN complexes de milers de ‘neurones’ simulades, organitzades en dotzenes o centenars de capes interconnectades.

Les neurones de la primera capa reben una dada d’entrada o senyal -com la intensitat d’un píxel en una imatge- i realitzen càlculs per lliurar com a resultat un nou senyal a les neurones de la següent capa, i així fins a obtenir un resultat final10.

La profunditat del ‘deep learning’ -aprenentatge profund-, es refereix a l’arquitectura de les màquines en les capes esmentades, anàlogues a la profunditat de les capes de neurones interconnectades del cervell.

foto

Malgrat el que ja dura la investigació en IA, només en aquest segle XXI11, i concretament a partir de l’any 2006, sembla haver-se donat el tret de sortida a una carrera darrere de produir eines tant per a ús de qualsevol ciutadà com per a ús industrial -robótica- i empresarial.

Ha estat en aquest segle quan, d’una banda, s’ha disposat de la quantitat de dades suficient com per poder alimentar el ‘aprenentatge’ d’una màquina; i, d’altra, s’ha assolit una eficiència i potència de càlcul en les màquines notablement superior a les coetànies dels principals algoritmes i models de la IA del passat segle.

Així les coses, l’any 2006 Geoffrey Hinton i Ruslan Salakhutdinov -membres, tots dos, en aquest moment del departament de ‘computer science’ de la Universitat de Toronto12- van publicar com accelerar el procés de ‘deep learning’, popularitzant aquest concepte, i impulsant la IA.

Des de llavors s’ha progressat molt. El reconeixement de fotografies -per exemple, les dels gats, (Google, 2012) o les de persones (Facebook, 2015) -, els anomenats ‘assistents virtuals’ amb reconeixement del llenguatge natural -Siri, Cortana o Alexa-, o les aplicacions de recerca, anàlisi i classificació de tota mena de dades -com ofereix la plataforma ‘Watson’ de IBM-, són tots exemples d’aquest progrés.

És precisament a IBM, i concretament a la seva plataforma ‘Watson’ d’IA, a qui se li associen els termes ‘computació cognitiva’ i ‘sistemes cognitius’. El Dr John I. Kelly III, vicepresident d’IBM Research, en un document del 2015, defineix aquests termes com ‘referits a sistemes que aprenen a escala, raonen amb un propòsit i interactuen amb humans de manera natural. En comptes de ser explícitament programats, aprenen i raonen des de la seva interacció amb nosaltres i des seves experiències amb el entorno’13.

Una proposta molt similar a la recollida en la convocatòria de l’any 1955 per la Conferència de Dartmouth, ja citada.

Sobre la computació cognitiva en les organitzacions

Tornant a la investigació duta a terme per l’equip del CISR14, en l’article es declara com a objectiu d’aquesta investigació respondre a una sèrie de preguntes: Com de disruptiva és la computació cognitiva (CC)? Canviarà radicalment el CC dels negocis i els treballs? Què han de fer els líders del negoci per treure profit de les possibilitats que li ofereixen? Com evitar els riscos desconeguts? Al meu parer, unes incògnites perfectament plantejables en l’àmbit de l’adopció i ús, per part de les organitzacions, de les tecnologies de la informació.

El document defineix la CC “com un sistema que adapta els seus algoritmes o processament subjacents depenent de l’exposició a noves dades” 15. D’això es pot deduir que, a l’hora de desenvolupar aquest sistema es necessiten en primer lloc, moltes dades, i, en segon lloc, temps per estabilitzar els algoritmes i aconseguir els resultats buscats.

Els usos que els negocis puguin fer de la CC seran útils si els productes que la incorporin són consistents, precisos i fiables. Aquests usos tenen el potencial de fer més eficients els processos operatius i de presa de decisions; però, per això, aquests processos s’han d’entendre molt bé, han d’estar molt ben dissenyats i ja han d’estar digitalitzats, com a condicions prèvies a la seva automatització emprant CC.

foto

Els autors declaren que en la investigació inicial ‘aprendre cinc lliçons’:

1a lliçó: la CC s’ha d’aplicar a tasques definides molt concretes. Com ja s’ha vist anteriorment, els dos fets rellevants que han permès el desenvolupament de la IA han estat la disponibilitat de potència de processament, i de l’altra, el fàcil accés a gran quantitat de dades electròniques. Aquests dos fets han permès innombrables i ràpides iteracions d’aplicacions que podien provar hipòtesis, obtenir patrons i optimitzar models.

Com a resultat, els negocis poden obtenir èxit en aplicar eines d’aprenentatge de les màquines només als processos que 1) tinguin un resultat establert; 2) siguin molt repetitius, i 3) depenguin de dades electròniques accessibles i interpretables.

Per exemple: l’avaluació d’un crèdit bancari a un client potencial.

2a Lliçó: Molts problemes de negoci no són adequats per a la CC. La CC no pot conformar decisions sobre entorns d’alta incertesa o ràpid canvi, per exemple, perquè no hi ha encara eines de base, perquè les dades rellevants pot ser que no es coneguin o no estiguin disponibles, i la freqüència d’un tipus de decisió sigui baixa . A això es pot afegir que algunes decisions depenen més d’un instint creatiu que d’un argument de patrons establerts.

3a Lliçó: Les màquines aprenen només si els humans les entrenen molt. Per exemple, la preparació de Watson per guanyar el concurs Jeopardy va portar sis anys d’esforç.

L’ús de CC en diagnòstic mèdic requereix alimentar la màquina amb una gran quantitat d’investigacions mèdiques, així com d’historials de pacients.

Algunes aplicacions requereixen un gran esforç d’ensenyament abans que els algoritmes s’estabilitzin: el processament del llenguatge natural segueix regles gramaticals, però el vocabulari pot ser molt variable en el seu significat, depenent de molts factors, entre ells, el context.

En entorns canviants, el procés d’ensenyament ha de continuar ja que els motors de recomanacions han de ser re-entrenats per adaptar-se als canvis en productes i serveis.

4ª Lliçó: En molts casos són els comercials els més ben posicionats per recuperar les inversions en CC. El rendiment de la CC arriba només després que un sistema tingui una sòlida base de coneixement, per la qual cosa, com ja s’ha dit, es necessita temps i esforç.

Per a moltes aplicacions de negoci, és possible que una sola companyia no pugui justificar la inversió requerida per, recollir, dissenyar i emmagatzemar les dades, i els models inicials per començar l’aprenentatge de la màquina.

Els comercials poden recuperar les inversions venent els sistemes a altres companyies. D’altra banda, per a moltes aplicacions de la CC, les empreses farien bé en esperar productes que oferissin una base de coneixement i el model inicial per poder començar el seu projecte CC.

5ª Lliçó: Les companyies han de procedir de manera gradual per implementar aplicacions de CC. L’èxit de l’aplicació al negoci de la CC va de la mà del creixement dels individus en la seva comprensió del negoci. Un coneixement vague en les regles del negoci, limita les possibilitats d’èxit en l’adopció i ús de la CC. Si el resultat desitjat no està clar o les dades que es requereixen no estan disponibles, una tasca no serà adequada per a la CC.

Una estratègia gradual de valor afegit per a la CC seria la següent:

  • Les empreses estableixen bones regles de negoci mitjançant les persones, els qui en executar una tasca aprenen les relacions entre diferents dades d’entrada i els seus resultats;
  • Amb el temps, els resultats s’entenen prou bé com perquè es puguin automatitzar les tasques repetitives;
  • L’automatització permet provar les regles de negoci en diferents contextos, analitzar les relacions entre dades d’entrada i resultats i elaborar o ajustar les regles;
  • En sistemes tancats, les relacions entre dades d’entrada i resultats podria ser prou clara com per permetre eines d’anàlisi predictiu; i,
  • Per problemes complexos, el CC podria ser una opció si el sistema pogués tenir accés a suficients dades útils de tal manera que la màquina tingués una base per adaptar els seus propis algoritmes.

Conclusions

Els autors de l’article conclouen que, al contrari que el que es diu d’ella, el CC no serà probablement tan disruptiva per a la majoria de les empreses. Algunes d’aquestes aconseguiran beneficis desenvolupant productes de negoci o de consum que incorporin capacitats de CC.

No obstant això, la majoria dels líders empresarials trobaran el millor camí per impulsar les oportunitats i gestionar els riscos de la CC, invertint en la millora gradual dels seus processos. Amb el temps, la millora dels processos produirà un augment en l’automatització i, potser, condueixin a processos de CC.

[1]            A.M.Turing (1950)  ‘Computing Machinery and Intelligence. Mind 49: 433-460’. ‘The Imitation Game’/ ‘I propose to consider the question, ‘Can machines think?’ url [a 20170515] https://www.csee.umbc.edu/courses/471/papers/turing.pdf

[2]            Tom Simonite (20170512) ‘Nvidia CEO: Software Is Eating the World, but AI Is Going to Eat Software’ MIT Technoly Review. url [a 20170513]

https://www.technologyreview.com/s/607831/nvidia-ceo-software-is-eating-the-world-but-ai-is-going-to-eat-software/?set=607859

[3]            Jeanne W. Ross, Cynthia M. Beath, Monideepa Tarafdar (201612) ‘Five Things You Should Know About Cognitive Computing’. Reseach Briefing, Vol. xvi, Nº 12. MIT CISR url [a 20170514]  https://cisr.mit.edu/blog/documents/2016/12/15/2016_1201_cognitivecomputing_rossbeathtarafdar.pdf/

[4]            ‘A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence’ url [a 20170511] http://www-formal.stanford.edu/jmc/history/dartmouth/dartmouth.html

[5]            ‘The machine is provided with input and output channels and an internal means of providing varied output responses to inputs in such a way that the machine may be “trained” by a “trial and error’ process to acquire one of a range of input-output functions.” Ver referencia nota iv.

[6]              Jürgen Schmidhuber, (20141013) ‘Deep learning in neural networks: An overview’ Neural Networks Volume 61, January 2015, Pages 85–117. url [a 20170511]

http://www.sciencedirect.com/science/article/pii/S0893608014002135

[7]            La lista de participantes proporcionada por la  Wikipedia  (los premios no figuran): 1) Ray Solomonoff, 2) Marvin Minsky – Premio Turing, 3) John McCarthy  – Premio Turing, 4) Claude Shannon – Premio Nobel, 5) Trenchard More, 6) Nat Rochester, 7)Oliver Selfridge, 8) Julian Bigelow, 9) W. Ross Ashby, 10) W.S. McCulloch, 11) Abraham Robinson, 12) Tom Ette, 13)John Nash – Premio Nobel, 14) David Sayre, 15) Arthur Samuel, 16) Shoulders, 17) Shoulders’ friend, 18) Alex Bernstein, 19) Herbert Simon – Premio Nobel – Premio Turing, 20) Allen Newell – Premio Turing.  url [a 20160516] https://en.wikipedia.org/wiki/Dartmouth_workshop

[8]             Ver nota vii.

[9]            ‘It is the science and engineering of making intelligent machines, especially intelligent computer programs’ entendida la inteligencia como ‘Intelligence is the computational part of the ability to achieve goals in the world’. J.McCarthy (20071211) ‘What is Artificial Intelligence’. Stanford.edu  url [a 20170511] http://www.formal.stanford.edu/jmc/whatisai/node1.html

[10]            https://www.technologyreview.com/s/604087/the-dark-secret-at-the-heart-of-ai/

[11]            ‘A Short History Of Deep Learning – Everyone Should Read’  Forbes. https://www.forbes.com/sites/bernardmarr/2016/03/22/a-short-history-of-deep-learning-everyone-should-read/2/#a34cb06710c4

[12]            G. E. Hinton, R. R. Salakhutdinov. ‘Reducing the Dimensionality of Data with Neural Networks’  ’28 July 2006 VOL 313 SCIENCE’ https://www.cs.toronto.edu/~hinton/science.pdf

[13]            ‘Cognitive computing refers to systems that learn at scale, reason with purpose and interact with humans naturally. Rather than being explicitly programmed, they learn and reason from their interactions with us and from their experiences with their environment.’  John E. Kelly III (oct, 2015)  ‘Computing, cognition and the future of knowing’ IBM. url [a 20170514] http://www.research.ibm.com/software/IBMResearch/multimedia/Computing_Cognition_WhitePaper.pdf

[14]            Ver nota iii.

[15]            “We define cognitive computing as a system that adapts its underlying algorithms or processing based on exposure to new data”. Ver referencia en nota iii.

Llegir més