ACTUALITÉ SCIENTIFIQUE
ET INNOVATION DE L'ÉTS
Optimiser la qualité des services de messagerie multimédia (MMS) - Par : Steven Pigeon, Stéphane Coulombe,

Optimiser la qualité des services de messagerie multimédia (MMS)


Stéphane Coulombe
Stéphane Coulombe Profil de l'auteur(e)
Stéphane Coulombe est professeur au Département de génie logiciel et des TI de l’ÉTS. Ses intérêts de recherche portent sur le traitement numérique des images et des vidéos, l’adaptation média et le transcodage

Image d’entête de Adam Fagen, licence CC, source.

Introduction

Chaire-Vantrix-FR copieLe service de messagerie multimédia (MMS) permet aux utilisateurs de terminaux hétérogènes d’échanger des messages structurés et composés de textes, de sons, d’images et de vidéos [1]. Il représente une source de revenus appréciable pour les exploitants de téléphonie mobile. Selon l’entreprise de recherche Portio Research, 207 milliards de messages MMS ont été envoyés en 2011; on s’attend à ce que ce nombre grimpe à 276,8 milliards en 2016. En raison de ce grand volume de messages, les MMS se maintiendraient en deuxième position parmi les services mobiles non vocaux existants les plus utilisés, derrière les très lucratifs SMS (Short Message Service) [2, 3]. Informa prédit un nombre de MMS encore plus grand en 2016. Selon elle, 387,5 milliards de MMS seront envoyés, représentant 10,6 % des revenus globaux générés par messagerie (aux États-Unis, 20,7 milliards de dollars US) [4]

L’architecture MMS

Les spécifications techniques du MMS ont été définies par le « 3rd Generation Partnership Project » (3GPP)) et par l’« Open Mobile Alliance » (OMA) (puis adapté par le 3GPP2). Une vue d’ensemble de l’implantation de l’architecture MMS dans les réseaux cellulaires est présentée à la figure 1 [5, 6]

Fig.1 The multimedia messaging network architecture. Source [Img1]

Fig.1 : l’architecture du réseau de messagerie multimédia. Source [Img1]

Le MMSC (Multimedia Message Service Center), aussi appelé serveur de relais MMS ou serveur mandataire de relais MMS, emmagasine le message envoyé par l’utilisateur et le relaie au destinataire. Comme montré à la figure 1, le MMSC fournit l’accès au réseau cellulaire au moyen de l’interface MM1 (ou point de référence) [5] lorsque les deux utilisateurs qui échangent un message multimédia utilisent le même opérateur de messagerie multimédia. Si les opérateurs sont différents, l’interface MM4 est alors utilisée entre les serveurs de relais MMS de chacun des utilisateurs. Le MMSC donne accès à des services à valeur ajoutée aux fournisseurs de service (contenu optionnel pour les courriels et le web) par l’interface MM7. L’accès à des serveurs externes, tels que des serveurs de courriels ou de télécopies, s’effectue par le point de référence MM3. L’interface MM11 permet au MMSC d’accéder au serveur externe de transcodage afin d’adapter le message; elle est normalisée par le « OMA Standard Transcoding Interface » (STI) v1.0 [5, 7]. Ces interfaces sont conçues pour fonctionner à l’aide des protocoles WAP/WSP et HTTP afin d’en permettre l’interopérabilité

L’accroissement du volume de MMS

Au fur et à mesure que l’utilisation des MMS augmente et que les normes évoluent, les fournisseurs de services mobiles doivent gérer un nombre toujours croissant de messages, au contenu multimédia toujours plus élaboré. Cette tâche colossale ne se réduit pas au seul envoi des messages parce que ces derniers doivent être adaptés soit par le MMSC, soit par un serveur externe de transcodage connecté au MMSC afin d’assurer l’interopérabilité entre les utilisateurs [8]. Le très grand volume de messages à gérer par les fournisseurs de services mobiles nécessitera des algorithmes adaptés et efficaces ainsi que des stratégies permettant de répondre à la demande, à la croissance et à l’évolution des normes et des solutions aux problèmes de mise à l’échelle.

Caractérisation du terminal de destination

Pour les applications MMS, le profil d’un terminal de destination est caractérisé par ses capacités, ou plus précisément par ses limites. Le profil détermine la taille maximale en octets d’un message multimédia, les types de médias que le terminal est en mesure d’interpréter et les contraintes spécifiques reliées à chacun de ces types de médias, par exemple la résolution maximale de l’image. Un terminal ayant un profil de gestion des messages à contenu élaboré (content rich) pourra envoyer des images JPEG ou GIF pouvant atteindre une résolution de 1600 sur 1200 pixels et dont la taille maximale sera de 600 ko [9]. Par contre, un terminal au profil plus limité dans la gestion du contenu d’images de base ne pourra gérer que des images d’une résolution de 160 sur 120 pixels et d’une taille maximale de 30 ko. La figure no 2 montre que le message envoyé d’un terminal permettant du contenu élaboré a été adapté avant d’être remis au terminal dont le profil est plus limité (images de base).

Fig.2 Typical multimedia message transactions between two heterogeneous terminals. Source [Img1]

Fig.2 : transaction multimédia typique entre deux terminaux hétérogènes. Source [Img1]

La figure no 2 montre le chemin emprunté généralement pour la livraison d’un message multimédia entre deux terminaux mobiles ayant le même exploitant [10].

Adaptation du contenu multimédia par le serveur

L’adaptation de contenu multimédia par le serveur permet non seulement à chacune des pièces jointes multimédias d’être compatibles avec le terminal de destination, mais aussi à ce dernier d’interpréter correctement le message entier. Toute pièce jointe doit être caractérisée et transformée au besoin pour respecter les contraintes du terminal de destination, en ajustant soit son format, soit sa résolution. Sans adaptation par le serveur, un message qui excède les capacités du terminal de destination (soit par la taille ou par le type du média) peut entraîner différents problèmes allant de la transmission incomplète du message à la panne du terminal de destination. Si le serveur est en mesure de déterminer les capacités du terminal de destination, mais qu’il est incapable d’effectuer l’adaptation, une autre stratégie s’offre à lui : envoyer seulement un message texte (SMS) accompagné d’un lien permettant à l’utilisateur de récupérer le message d’origine en le téléchargeant ou en parcourant le web par d’autres moyens [11]. Bien que cette méthode permette de livrer tout le contenu, elle n’offre pas une expérience satisfaisante à l’usager; l’adaptation du contenu multimédia par le serveur est donc préférable.

Source [Img2]

Source [Img2]

Nous avons démontré dans nos travaux précédents que les stratégies combinant à la fois l’adaptation des paramètres de compression JPEG et de son échantillonnage donnent des résultats significativement meilleurs que l’utilisation d’une seule de ces méthodes [12].

Projet de recherche

Adapter une image (même en format JPEG) selon des contraintes de taille de fichier et de résolution maximales tout en maximisant la qualité perçue d’une manière efficace d’un point de vue informatique demeure un défi. En effet, il n’existe aucune méthode pour estimer la taille du fichier résultant et la qualité d’une image peut varier selon les paramètres de compression et de résolution. Pour y parvenir, nous avons proposé des prédicteurs et des façons de faire dans nos travaux précédents pour adapter des images et des messages [12, 13, 14]. Ces prédicteurs ont été exploités au cours d’autres travaux [15, 16] pour développer un cadre d’adaptation dynamique de contenu appliqué aux outils de présentation en collaboration pour appareils mobiles (c’est-à-dire « Open Office Impress presentations »). Lors de nos travaux précédents [17], nous avons proposé un cadre général, basé sur une programmation dynamique, pour l’adaptation de messages segmentés, composés uniquement d’images, selon des contraintes données de terminal de réception. Dans cet article, nous étendons nos travaux à la maximisation explicite de la qualité perçue du message entier au moyen d’un nouvel algorithme, une programmation dynamique par étape.

Solution proposée

Au lieu de transcoder chacune des combinaisons de paramètres de transcodage examinées, nous allons utiliser des prédicteurs rapides qui, selon une caractérisation (superficielle) donnée d’une image m (telle que la taille d’origine, le facteur de qualité et la résolution) et des paramètres de transcodage t, prédiront la taille et la qualité résultante de T (m; t), l’image transcodée m à laquelle les paramètres t ont été appliqués.

Nous avions présenté ces prédicteurs lors de nos travaux précédents [12, 14]. Dans l’étude actuelle, nous utilisons le prédicteur de taille du fichier et de qualité présenté dans [12] qui est appelé JQSP (JPEG Quality and Size Predictor). Afin d’évaluer la résilience des méthodes proposées à l’erreur de prédiction, nous utiliserons en plus de JQSP, des prédicteurs oraculaires (prédicteurs dont les caractéristiques sont connues) et en discuteront dans cet article.

Nous avons utilisé le bien connu « Structural Similarity Index » (SSIM) proposé par Wang et al [18] pour estimer la qualité visuelle perçue des images transformées. Nous avons choisi le SSIM en raison de sa popularité dans la communauté scientifique et de sa grande précision. Une évaluation statistique d’algorithmes FR récents utilisés pour l’évaluation de la qualité des images a été effectuée au moyen de diverses banques d’images [19]. Les résultats ont montré que le SSIM était très précis pour plusieurs types de distorsions.

La deuxième des méthodes proposées, que nous avons appelée « programmation dynamique par étape », atténue la propagation d’erreur par un raffinage itératif. Au départ, la programmation dynamique par étape optimise globalement le message et détermine la série de paramètres de transcodage optimaux prévus, mais ne transcode que la première image (en ordre de pièce jointe). Une fois la première image transcodée, sa taille réelle est observée et le travail nécessaire aux images restantes est ajusté en tenant compte de la différence entre la prédiction de première image transcodée et celle obtenue en réalité.

Résultats expérimentaux

Pour notre expérience, nous avons créé quatre groupes de 1 000 MMS contenant de deux (le minimum requis pour avoir un message segmenté) à cinq images jointes. Les images, dont la résolution variait entre 320 sur 200 pixels et 3 000 sur 2 000 pixels ont été sélectionnées de façon aléatoire et uniforme parmi une banque contenant 370 000 images, construite en navigant sur le web durant l’automne 2010 [17]. Le profil choisi pour tester l’adaptation dans notre expérience était « image à résolution élevée » (permettant une résolution allant jusqu’à 640 sur 480 pixels et une taille maximale de message de 100 ko). L’adaptation des messages MMS originaux dans le profil « image à résolution élevée » (grosseur moyenne des messages de 284 ko 563 ko, 790 ko, 1,2 Mo, et 1,4 Mo pour la 1ère, 2e, 3e, 4e et 5e pièce jointe, respectivement) démontre que les divers algorithmes testés ont été soumis de façon intense à un ratio d’adaptation allant jusqu’à environ 14:1. L’architecture d’ensemble des tests est présentée à la figure no 3.

Fig.3 MMS adaptation validation architecture. Source [Img1]

Fig.3 : architecture de validation de l’adaptation des MMS. Source [Img1]

Conclusion

Dans cette recherche, nous avons démontré que les deux algorithmes proposés d’adaptation de messages segmentés à l’aide de prédicteurs obtenus par programmation dynamique maximisent explicitement la qualité (comme un serveur mandataire pour les utilisateurs) et font aussi meilleur usage de la capacité du message (la portion de la taille permise d’un message) par rapport aux algorithmes inspirés des produits offerts actuellement sur le marché et décrits dans la littérature scientifique. Nous avons aussi démontré que, bien que la précision des prédicteurs soit importante, la qualité obtenue ne diminuait pas de façon importante avec l’augmentation de l’erreur de la prédiction; ces algorithmes sont donc robustes pour la prédiction d’erreurs. De plus, nos algorithmes proposés sont significativement plus rapides et meilleurs que les solutions précédentes et seraient d’un grand intérêt pour les services de messagerie multimédias.

Article de recherche

Pour plus d’information sur le sujet, nous vous invitons à lire l’article suivant :logo espace150

Pigeon, Steven et Coulombe, Stéphane. 2014. « Quality-aware predictor-based adaptation of still images for the multimedia messaging service ». Multimedia Tools and Applications, vol. 72, nº 2. p. 1841-65.

ETS_vantrix_1mod

 

Steven Pigeon

Profil de l'auteur(e)

Profil de l'auteur(e)

Stéphane Coulombe

Profil de l'auteur(e)

Stéphane Coulombe est professeur au Département de génie logiciel et des TI de l’ÉTS. Ses intérêts de recherche portent sur le traitement numérique des images et des vidéos, l’adaptation média et le transcodage

Programme : Génie logiciel  Génie des technologies de l'information 

Profil de l'auteur(e)