Faculté informatique et communications IC, Section des systèmes de communication, Institut de systèmes de communication ISC (Laboratoire pour les communications informatiques et leurs applications 2 LCA2)

Delay aspects in Internet telephony

Boutremans, Catherine ; Le Boudec, Jean Yves (Dir.)

Thèse sciences techniques Ecole polytechnique fédérale de Lausanne EPFL : 2003 ; no 2715.

Ajouter à la liste personnelle
    Summary
    In this work, we address the transport of high quality voice over the Internet with a particular concern for delays. Transport of interactive audio over IP networks often suffers from packet loss and variations in the network delay (jitter). Forward Error Correction (FEC) mitigates the impact of packet loss at the expense of an increase of the end-to-end delay and the bit rate requirement of an audio source. Furthermore, adaptive playout buffer algorithms at the receiver compensate for jitter, but again this may come at the expense of additional delay. As a consequence, existing error control and playout adjustment schemes often have end-to-end delays exceeding 150 ms, which significantly impairs the perceived quality, while it would be more important to keep delay low and accept some small loss. We develop a joint playout buffer and FEC adjustment scheme for Internet Telephony that incorporates the impact of end-to-end delay on perceived audio quality. To this end, we take a utility function approach. We represent the perceived audio quality as a function of both the end-to-end delay and the distortion of the voice signal. We develop a joint rate/error/playout delay control algorithm which optimizes this measure of quality and is TCP-Friendly. It uses a channel model for both loss and delay. We validate our approach by simulation and show that (1) our scheme allows a source to increase its utility by avoiding increasing the playout delay when it is not really necessary and (2) it provides better quality than the adjustment schemes for playout and FEC that were previously published. We use this scheme in the framework of non-elevated services which allow applications to select a service class with reduced end-to-end delay at the expense of a higher loss rate. The tradeoff between delay and loss is not straightforward since audio sources may be forced to compensate the additional losses by more FEC and hence more delay. We show that the use of non-elevated services can lead to quality improvements, but that the choice of service depends on network conditions and on the importance that users attach to delay. Based on this observation, we propose an adaptive service choosing algorithm that allows audio sources to choose in real-time the service providing the highest audio quality. In addition, when used over the standard IP best effort service, an audio source should also control its rate in order to react to network congestion and to share the bandwidth in a fair way. Current congestion control mechanisms are based on packets (i.e., they aim to reduce or increase the number of packets sent per time interval to adjust to the current level of congestion in the network). However, voice is an inelastic traffic where packets are generated at regular intervals but packet size varies with the codec that is used. Therefore, standard congestion control is not directly applicable to this type of traffic. We present three alternative modifications to equation based congestion control protocols and evaluate them through mathematical analysis and network simulation.
    Résumé
    Dans ce travail, nous nous penchons sur la transmission de voix haute fidélité dans le réseau Internet, avec un souci particulier pour les problèmes liés au temps de transmission de bout en bout. La qualité des conversations interactives par Internet souffre de la perte de paquets et de la variation de leurs temps de parcours (gigue). L'effet des pertes peut être atténuée par des mécanismes de correction d'erreur en boucle ouverte (Forward Error Correction - FEC), mais ceci au prix d'un délai supplémentaire et d'une augmentation du débit à la source. La gigue est absorbée par un tampon de lissage (playout buffer) placé à la destination, dont la taille est contrôlée de manière adaptative. Mais ceci s'effectue à nouveau au prix d'un retard additionnel. En conséquence, les algorithmes de contrôle d'erreur et d'ajustement du tampon de lissage entraînent souvent des délais de bout en bout qui dépassent 150 ms, ce qui dégrade considérablement la qualité de la conversation, alors qu' il serait préférable de conserver un retard un peu moins important, au prix de quelques pertes supplémentaires. Dans ce travail de thèse, nous proposons un algorithme d'adaptation conjointe de la FEC et du tampon de lissage pour la téléphonie sur Internet qui tient compte de l'influence du délai sur la qualité des conversations. Notre approche est basée sur une fonction d'utilité. Nous définissons la qualité perc¸ue comme une fonction de la distorsion du signal et du retard total subi par le signal. Nous développons un algorithme de contrôle de conjoint des trois paramètres: débit de la source, stratégie de correction d'erreur et tampon de lissage qui maximise cette mesure de la qualité et qui soit TCP-Friendly. Cet algorithme est basé sur un modèle de canal qui considère les pertes et les délais de transmission. Nous prouvons le bien-fondé de notre approche par simulations et démontrons que (1) notre système permet à une source d'obtenir une utilité supérieure en lui évitant de d'augmenter le retard à la restitution lorsque ce n'est pas vraiment nécessaire et (2) il permet d'obtenir une qualité supérieure à celle obtenue avec d'autres mécanismes de contrôle d'erreur et de tampon de lissage publiés précédemment. Nous utilisons notre algorithme de contrôle dans le cadre des services non-elevated qui permettent aux applications de sélectionner un service à délai de transmission réduit au prix de taux de pertes de paquets plus élevés. Le compromis entre délai et pertes n'est pas limpide dans le cas des sources audio car celles-ci pourraient être forcées de compenser les pertes supplémentaires par un augmentation de la redondance (FEC) ce qui entraînerait un accroissement du délai de bout en bout. Nous montrons que l'utilisation d'un service non-elevated permet d'améliorer la qualité, mais que le choix de la classe de service optimale dépend des conditions dans lesquelles se trouvent le réseau et de l'importance que l'utilisateur attache au retard. Sur base de ces observations, nous proposons un algorithme de sélection de service qui permet à une source de déterminer en temps réel le service procurant la meilleure qualité. De plus, une source audio qui utilise le service best-effort (meilleur service possible) de l'Internet est tenue de contrôler son débit de manière a réagir aux congestions dans le réseau et à partager la bande passante de manière équitable avec les autres connexions. Les mécanismes de contrôle de congestion actuels tendent a contrôler le nombre de paquets émis par les sources de manière à ajuster le débit en fonction du niveau de congestion dans le réseau. Toutefois, la voix constitue un trafic "inélastique" où les paquets sont émis à intervalles réguliers mais où la taille de paquet peut varier en fonction du codeur utilisé. Par conséquent, les mécanismes standards de contrôle de congestion ne sont pas applicables à ce type de trafic. Nous présentons un choix de trois modifications possibles pouvant être apportées aux protocoles de contrôle de congestion, que nous évaluons au moyen d'une analyse mathématique et de simulations de réseaux.