Designing new network adaptation and ATM adaptation layers for interactive multimedia applications

Garcia Adanez, Francisco Javier ; Hubaux, Jean-Pierre (Dir.)

Thèse Ecole polytechnique fédérale de Lausanne EPFL : 1998 ; no 1782.

    Multimedia services, audiovisual applications composed of a combination of discrete and continuous data streams, will be a major part of the traffic flowing in the next generation of high speed networks. The cornerstones for multimedia are Asynchronous Transfer Mode (ATM) foreseen as the technology for the future Broadband Integrated Services Digital Network (B-ISDN) and audio and video compression algorithms such as MPEG-2 that reduce applications bandwidth requirements. Powerful desktop computers available today can integrate seamlessly the network access and the applications and thus bring the new multimedia services to home and business users. Among these services, those based on multipoint capabilities are expected to play a major role.    Interactive multimedia applications unlike traditional data transfer applications have stringent simultaneous requirements in terms of loss and delay jitter due to the nature of audiovisual information. In addition, such stream-based applications deliver data at a variable rate, in particular if a constant quality is required.    ATM, is able to integrate traffic of different nature within a single network creating interactions of different types that translate into delay jitter and loss. Traditional protocol layers do not have the appropriate mechanisms to provide the required network quality of service (QoS) for such interactive variable bit rate (VBR) multimedia multipoint applications. This lack of functionalities calls for the design of protocol layers with the appropriate functions to handle the stringent requirements of multimedia.    This thesis contributes to the solution of this problem by proposing new Network Adaptation and ATM Adaptation Layers for interactive VBR multimedia multipoint services.    The foundations to build these new multimedia protocol layers are twofold; the requirements of real-time multimedia applications and the nature of compressed audiovisual data.    On this basis, we present a set of design principles we consider as mandatory for a generic Multimedia AAL capable of handling interactive VBR multimedia applications in point-to-point as well as multicast environments. These design principles are then used as a foundation to derive a first set of functions for the MAAL, namely; cell loss detection via sequence numbering, packet delineation, dummy cell insertion and cell loss correction via RSE FEC techniques.    The proposed functions, partly based on some theoretical studies, are implemented and evaluated in a simulated environment. Performances are evaluated from the network point of view using classic metrics such as cell and packet loss. We also study the behavior of the cell loss process in order to evaluate the efficiency to be expected from the proposed cell loss correction method. We also discuss the difficulties to map network QoS parameters to user QoS parameters for multimedia applications and especially for video information. In order to present a complete performance evaluation that is also meaningful to the end-user, we make use of the MPQM metric to map the obtained network performance results to a user level. We evaluate the impact that cell loss has onto video and also the improvements achieved with the MAAL.    All performance results are compared to an equivalent implementation based on AAL5, as specified by the current ITU-T and ATM Forum standards.    An AAL has to be by definition generic. But to fully exploit the functionalities of the AAL layer, it is necessary to have a protocol layer that will efficiently interface the network and the applications. This role is devoted to the Network Adaptation Layer.    The network adaptation layer (NAL) we propose, aims at efficiently interface the applications to the underlying network to achieve a reliable but low overhead transmission of video streams. Since this requires an a priori knowledge of the information structure to be transmitted, we propose the NAL to be codec specific.    The NAL targets interactive multimedia applications. These applications share a set of common requirements independent of the encoding scheme used. This calls for the definition of a set of design principles that should be shared by any NAL even if the implementation of the functions themselves is codec specific. On the basis of the design principles, we derive the common functions that NALs have to perform which are mainly two; the segmentation and reassembly of data packets and the selective data protection.    On this basis, we develop an MPEG-2 specific NAL. It provides a perceptual syntactic information protection, the PSIP, which results in an intelligent and minimum overhead protection of video information. The PSIP takes advantage of the hierarchical organization of the compressed video data, common to the majority of the compression algorithms, to perform a selective data protection based on the perceptual relevance of the syntactic information.    The transmission over the combined NAL-MAAL layers shows significant improvement in terms of CLR and perceptual quality compared to equivalent transmissions over AAL5 with the same overhead.    The usage of the MPQM as a performance metric, which is one of the main contributions of this thesis, leads to a very interesting observation. The experimental results show that for unexpectedly high CLRs, the average perceptual quality remains close to the original value. The economical potential of such an observation is very important. Given that the data flows are VBR, it is possible to improve network utilization by means of statistical multiplexing. It is therefore possible to reduce the cost per communication by increasing the number of connections with a minimal loss in quality.    This conclusion could not have been derived without the combined usage of perceptual and network QoS metrics, which have been able to unveil the economic potential of perceptually protected streams.    The proposed concepts are finally tested in a real environment where a proof-of-concept implementation of the MAAL has shown a behavior close to the simulated results therefore validating the proposed multimedia protocol layers.
    Les applications multimédia qui combinent différents flux de données audiovisuelles occuperont une place importante dans la prochaine génération de réseaux à haut débit. Les composantes clé du multimédia sont le mode de transfert asynchrone (ATM) considéré comme la technologie du futur réseau numerique à integration de services à large bande (B-ISDN) ainsi que les algorithmes de compression de données audiovisuelles comme MPEG-2 qui réduisent les besoins en largeur de bande des applications. De plus, la disponibilité d'ordinateurs capables d'intégrer de façon transparente l'accès au reseau est en train de généraliser les applications multimédia tant dans les entreprises que pour les loisirs. Parmi ces applications, celles basées sur le multipoint seront appelées à jouer un rôle majeur.    Contrairement aux applications de transfert de données traditionnelles, les applications multimédia interactives ont des fortes contraintes en termes de pertes et de délais de par la nature même des informations audiovisuelles. En outre, ces applications delivrent les données à un débit variable, en particulier si une qualité vidéo constante est requise.    ATM permet d'integrer différents types de trafic dans un même réseau ce qui crée des interactions qui se traduisent par des délais et des pertes. Les protocoles traditionnels ne possedent pas les mécanismes appropriés pour offrir la qualité de service (QoS) réseau requise par les applications multimédia interactives à débit variable. Ce manque de fonctionalités requiert le design de nouvelles couches de protocoles capables de gérer les contraintes propres à ces applications.    Cette thèse contribue à résoudre ce problème en proposant de nouvelles couches d'adaptation réseau et ATM pour des services multipoint multimédia interactifs à débit variable.    Les nouvelles couches de protocole proposées sont développées d'après les besoins des applications multimédia temps-réel et la nature des données audiovisuelles compressées.    Sur cette base, nous présentons une série de principes estimés comme nécessaires pour une AAL multimédia génerique capable de gérer des applications interactives à débit variable tant dans des environnements point-à-point que multipoint. Cette série de principes de conception sont alors utilisés pour développer les fonctions de la MAAL, à savoir, détection de cellules perdues par un numéro de séquence, segmentation des paquets, insertion de cellules vides et correction d'erreurs via des techniques FEC basées sur des codes de type RSE.    Les fonctions proposées, en partie basées sur des études théoriques, sont implementées dans un environnement simulé. Les performances sont evaluées d'un point de vue réseau en utilisant des métriques classiques comme les pertes de cellules et de paquets. On étudie aussi le comportement des processus de pertes de façon à évaluer l'efficacité du mécanisme de correction de pertes proposé.    Ce travail aborde aussi le problème du "mapping" entre les paramètres de qualité de service réseau et utilisateur en particulier en ce qui concerne la vidéo. De façon à présenter une évaluation de performances complète qui ait aussi un sens pour l'utilisateur, nous utilisons une mesure de qualité vidéo perceptive, MPQM. Celle-ci permet de traduire les résultats obtenus au niveau du réseau vers le niveau utilisateur. Nous évaluons aussi l'impact que les pertes de cellules ont sur la vidéo et les améliorations obtenues avec la couche MAAL.    Les résultats sont comparés avec une implementation equivalente basée sur AAL5, comme specifié par les standards actuels de l'ITU-T et de l'ATM Forum.    Une AAL doit par définition être générique. Mais pour exploiter au maximum ses fonctionalités, il est nécessaire d'avoir une couche de protocole qui interfacera de façon efficace le réseau et les applications. Ce rôle est consacré à la couche d'adaptation réseau (NAL).    Cette couche d'adaptation a pour but d'interfacer de façon efficace les applications au réseau pour obtenir une transmission fiable, bien qu'avec un faible supplément d'information, de flux audiovisuels. Ceci nécessite une connaissance à priori de la structure de l'information à transmettre. Par conséquent, la couche NAL doit être spécifique à un codeur.    Les algorithmes de compression utilisés dans ces applications partagent une série de besoins communs indépendants du schéma d'encodage utilisé. Il est donc nécessaire de définir une série de principes de fonctionnement qui devraient être partagés par toutes les NALs, même si l'implémentation des fonctions elles-mêmes dépend de l'encodeur. Sur cette base nous définissons les fonctions propres aux couches NAL, à savoir: segmentation et reassemblage des paquets et protection selective des données.    A partir de ces fonctions nous avons développé une couche NAL spécifique au codeur MPEG-2. Elle offre une protection syntaxique perceptive de l'information, le PSIP, qui réalise une protection intelligente des flux vidéo avec un surplus d'information minimum. Le PSIP profite de l'organisation structurée et hierarchique des données compressées pour effectuer une protection selective des informations basée sur l'importance perceptive des données syntaxiques.    La transmission de flux audiovisuels sur les deux couches de protocole NAL-MAAL montre des améliorations significatives au niveau du CLR ainsi qu'au niveau perceptif comparé à une transmission équivalente sur AAL5.    L'utilisation de MPQM comme mesure de performance, ce qui constitue une des contributions majeures de cette thèse, mène à une observation très importante. Les résultats expérimentaux montrent que pour des valeurs très élevées du CLR, la qualité perceptive moyenne reste très proche de la valeur originale. Le potentiel économique d'un tel phénomène est très important. Etant donné que les flux de données sont de type VBR, il est possible d'augmenter l'utilisation du réseau au moyen du multiplexage statistique. Il est ainsi possible de réduire le coût par communication en augmentant le nombre de connexions avec une reduction minimale de la qualité perceptive.    Cette conclusion n'aurait pas pu être obtenue sans l'utilisation combinée des mesures de qualité perceptive et réseau, qui ont permis de dévoiler le potentiel économique des flux protégés de façon selective et perceptive.    Les concepts proposés sont finalement testés dans un environnement réel dans lequel une implementation de la MAAL démontre un comportement similaire à celui obtenu par simulation validant ainsi les couches de protocole multimédia proposeées.