ACTUALITÉ SCIENTIFIQUE
ET INNOVATION DE L'ÉTS
Lire à livre fermé - Par : Alpa J Shah,

Lire à livre fermé


Alpa J Shah
Titulaire d’une maîtrise en génie des technologies de l’information de l’ÉTS et passionnée par l’intelligence artificielle. Elle vise à combler le fossé entre université et industrie en combinant ses antécédents en informatique à ses aptitudes en recherche.

Des chercheurs du Massachusetts Institute of Technology (MIT) ont créé une technologie afin de numériser une pile de papier allant jusqu’à neuf feuilles. Cette technique se base sur le rayonnement térahertz. Il sera très bientôt possible de numériser tout un livre, voire une pile de livres!

Barmak Heshmat, chercheur au MIT, a été intrigué par une étude, menée il y a une dizaine d’années, qui utilisait les ondes térahertz pour voir au travers d’une enveloppe fermée. Souhaitant utiliser le potentiel d’application de ces ondes, il a conçu le projet de recherche en prenant en considération la résolution temporelle de la spectroscopie térahertz pour lire une couche de plusieurs feuilles. Quatre éléments essentiels ont été déterminés : le rayonnement, la résolution temporelle, les renseignements relatifs au spectre d’encres différentes et un algorithme de reconnaissance des caractères.

La bande de fréquence des térahertz (THz), parfois appelée « onde submillimétrique », désigne des ondes électromagnétiques qui se situent entre les micro-ondes et l’infrarouge. Puisque l’absorption des fréquences des térahertz varie en fonction des différents produits chimiques, il est possible de distinguer l’encre du papier. Grâce à l’élément temporel, il est possible de distinguer entre les pages puisque celle sur le dessus sera lue avant celles dessous. En outre, la profondeur des pages aura aussi une incidence sur la force avec laquelle l’encre est détectée. Tous ces renseignements ont été réunis dans un ensemble de données à analyser en vue de la partie « lecture » réelle.

La partie « lecture » comportait trois algorithmes principaux : un algorithme aléatoire d’extraction de l’impulsion (PPEX, « probabilistic pulse extraction »), un algorithme à K moyennes et un algorithme de composition de la forme cardinale convexe (CCSC, « Convex Cardinal Shape Composition ») (Aghasi, Alireza et Justin Romberg, « Convex Cardinal Shape Composition », SIAM Journal on Imaging Sciences, 8.4 (2015), 2887-2950). L’algorithme PPEX a été conçu spécifiquement à cette fin, puisque les auteurs devaient analyser le rayonnement térahertz émis au moment d’atteindre le capteur. Il fallait, dans l’analyse, adapter le contraste de spectre qui distinguait entre l’encre et le papier, et ce, afin d’augmenter ce contraste. L’algorithme à K moyennes, l’algorithme de regroupement le plus courant et connu de presque tous les chercheurs du domaine, a été utilisé pour regrouper les points de l’augmentation du contraste basé sur le PPEX. Enfin, l’algorithme CCSC, élaboré par Alireza Aghasi et Justin Romberg, du Goergia Institute of Technology, reconnaissait la lettre réelle en fonction de sa forme.

algorithm-fig1

Figure 1 : Pour l’instant, l’algorithme calcule correctement la distance entre l’appareil photo et les 20 premières feuilles d’une pile. Mais après neuf pages, le signal émis est si faible que les différences entre les signatures des fréquences sont submergées par le bruit. Source : Barmak Heshmat.

Le code ainsi que toutes les données en appui aux découvertes de cette étude ont été rendus publics. Bien qu’il en soit à ses tout premiers débuts, ce travail ouvre la voie à un vaste éventail de perspectives de recherche, par exemple des capteurs par térahertz, des applications et des algorithmes afin d’analyser les données issues de capteurs de térahertz, des algorithmes de reconnaissance des lettres, etc.

imaging-system-fig2

Figure 2 : Un nouveau système d’imagerie en mesure de lire des livres fermés. « Le Metropolitan Museum de New York s’est montré vivement intéressé par le projet, afin, par exemple, de lire des livres anciens qu’on ne veut même pas toucher », explique Barmak Heshmat, un chercheur du MIT Media Lab. Photo aimablement fournie par Barmak Heshmat.

Ont aussi été discutées les applications d’une éventuelle version solide de cette technologie. L’attention de beaucoup de gens a été éveillée par l’idée, qu’il s’agisse d’antiquaires ou d’auteurs de science-fiction. Par exemple, des musées pourraient utiliser cette technologie par capteur pour lire des livres d’une grande importance historique, mais trop fragiles pour qu’on les manipule. Ou bien, il n’est pas difficile d’imaginer un film d’espionnage dans lequel un personnage « lit » des renseignements confidentiels sans laisser la moindre trace. Dans tous les cas, il s’agit très certainement d’une étape importante des progrès technologiques.

Auteure

alpa_profilepicture

Alpa J. Shah

Alpa J. Shah est titulaire depuis mai 2016 d’une maîtrise en génie des technologies de l’information de l’ÉTS. Passionnée par l’intelligence artificielle, elle possède de l’expérience en sciences des données, par exemple en apprentissage machine, en exploration de données, en modélisation statistique et en reconnaissance des formes. Elle vise à combler le fossé entre l’université et l’industrie en combinant ses antécédents en informatique à ses aptitudes en recherche.

 

[accordion title= »Références » close= »1″] http://news.mit.edu/2016/computational-imaging-method-reads-closed-books-0909

http://www.nature.com/articles/ncomms12665 [/accordion]

[accordion title= »Références des images » close= »1″]

Image d’en-tête achetée sur iStock. Droit d’auteur : Avosb.

Les autres illustrations ont aimablement été fournies par Barmak Heshmat. [/accordion]

Alpa J Shah

Profil de l'auteur(e)

Titulaire d’une maîtrise en génie des technologies de l’information de l’ÉTS et passionnée par l’intelligence artificielle. Elle vise à combler le fossé entre université et industrie en combinant ses antécédents en informatique à ses aptitudes en recherche.

Programme : Génie des technologies de l'information 

Profil de l'auteur(e)