Faculté des sciences

SoftwIre integration : an approach to service composition through distributed representations of arbitrary-length business ontologies

Ludolph, Hendrik ; Kropf, Peter (Dir.) ; Babin, Gilbert (Codir.)

Thèse de doctorat : Université de Neuchâtel, 2016.

The demand for Software as a Service is ever increasing. With this demand comes a proliferation of third-party service offerings to fulfill it. It thus becomes crucial for organizations to find and select the right service to be integrated into their existing tool landscapes. Ideally, this is done automatically and flexibly. The objective is to always provide the best possible support to changing... More

Add to personal list
    Résumé
    La demande de logiciel à la demande (Software as a Service ou SaaS) est en constante augmentation. Afin de remplir cette demande, une prolifération d’offres de services de type third-party s’en suit. Pour les organisations il est crucial de trouver et sélectionner le service approprié pour l’incorporer dans le parc TI existant. Idéalement, cela est effectué de façon continue et flexible, l’objectif étant de toujours fournir le meilleur support possible.
    Pour faire face à cet enjeu, des standards modernes d’intégrations tels que ESB, SOA ou BPI ont été conçus pour permettre un couplage faible (loose coupling) entre les services. Par contre, il manque à ces standards la capacité de bien décrire et capter la sémantique des services. Cette sémantique serait nécessaire pour une intégration automatique adéquate. L’efficacité de ces standards dépend aussi considérablement de l’intervention humaine. Une nouvelle génération de techniques sémantiques telles que SAWSDL, OWL-S ou WSMO vise à corriger cette situation en utilisant des ontologies. Ces dernières sont basées sur des règles formelles d’inférence, ayant l’ambition de représenter et d’interpréter le sens des données. Cela devrait mener à une sélection et intégration automatique supérieure de services.
    Nous croyons cependant que connaître et interpréter requiert plus que la manipulation réglementée et impérative d’expressions symbolique arbitraires. Selon nous, les approches purement symboliques, autant syntaxiques que sémantiques, ne permettent pas de combiner automatisation et flexibilité. Ceci est d’autant plus vrai dans des environnements compétitifs. Dans ces environnements, les changements d’offres de services ne peuvent être ni anticipés, ni gérés de façon contrôlée. Des conditions inconnues ne peuvent être traitées que dans la mesure où elles ont été prédéfinies.
    Afin de surmonter cette contradiction, nous proposons une approche hybride symbolique/connexionniste. À cette fin, nous présentons un cadre conceptuel de sélection automatique de services, basée sur des descriptions de haut niveau des besoins d’affaires. Ces descriptions sont décrites par des ontologies. Par la suite, nous explorons une topologie spécifique de réseau neuronal artificiel, nommé LRAAM. Avec ce dernier, la structure compositionnelle des ontologies est transformée dans une représentation distribuée (i.e., réduite, micro-sémantique). Le LRAAM amène le système à générer une représentation “propre” ou “interne” des descriptions ontologiques de services. Celles-ci peuvent être utilisées pour des analyses de similarité. Un outil (OntoProc) a été conçu comme preuve de concept. Avec celui-ci, nous conduisons différentes expériences afin d’étudier la validité de l’approche. Les données produites par l’outil ont fait l’objet d’analyse de signification statistique.
    Se basant sur les expériences conduites, nous ne pouvons pas conclure que l’implémentation de LRAAM utilisée est une alternative fiable pour la sélection et l’intégration de services. Nous démontrons que sous certaines conditions, le LRAAM produit une sélection correcte de services. Cependant, il n’est pas possible d’arriver à la même conclusion pour des données d’entrée plus complexes. Nous discutons des ajustements à faire à l’implémentation afin d’augmenter la performance de l’outil.
    Malgré des résultats non-concluants, nous sommes toutefois convaincu que des approches purement symboliques d’intégration automatique sont trop contraignantes quand il s’agit des services de type third-party. La flexibilité sans intervention humaine se situe au-delà de leurs capacités. Encouragé par des développements récents dans le domaine du connexionnisme (e.g., Deep Learning), nous adhérons tout de même à la piste de recherche choisie. Nous le voyons comme faisant partie d’un nouveau paradigme, qui est de traiter des larges vecteurs pour remplacer la manipulation réglementée de symboles.
    Summary
    The demand for Software as a Service is ever increasing. With this demand comes a proliferation of third-party service offerings to fulfill it. It thus becomes crucial for organizations to find and select the right service to be integrated into their existing tool landscapes. Ideally, this is done automatically and flexibly. The objective is to always provide the best possible support to changing business needs.
    Modern integration standards, such as ESB, SOA, or BPI evolved to face this challenge, e.g., through loose coupling. However, they lack description capabilities to adequately capture service semantics, needed for adequate automated service selection and integration. They also heavily depend on human expert intervention. Next generation semantic techniques, such as SAWSDL, OWL-S, or WSMO aim at correcting this situation. They use ontologies, which are based on formal rules of inference. These techniques claim to extract and interpret the meaning of data, thereby leading to more reliable automated service selection and integration.
    To us however, knowing and interpreting is more than imperative, rule-based manipulation of arbitrary symbolic expressions. Pure symbolic, either syntactic or formal-semantic, approaches will thus not provide the bridge between automation and flexibility. This is even more so in competitive environments. Here, changes in the input data of third-party services offerings can neither be anticipated, nor can technical control be exercised. Unknown conditions can thus only be processed to the extent they are predefined.
    To overcome this contradiction, we investigate a hybrid symbolic/connectionist approach. To this end, we provide a framework for automated service selection based on high-level business requirements, described by ontologies. Thereafter, we explore a specific supervised artificial neural network topology called LRAAM. With it, the compositional structure of the ontologies is transformed into a distributed (i.e., reduced, micro-semantic) representation. It shall enable the system to develop an “own” or “inner” representation of service descriptions, which are then used for similarity analysis. A tool (OntoProc) was developed as a proof of concept. With it, we conducted different experiments to explore the validity of the approach. The tool generated output data, which we submitted to significance tests.
    Based on the experiments, the current LRAAM implementation is not a reliable alternative for service selection and integration. We showed that the LRAAM performs correct selection of services under specific parameters. However, for more complex input data, it does not yet yield the expected results. We discussed adjustments to the implementation to improve OntoProc’s performance. Despite the inconclusive results, we are, nevertheless, convinced that purely symbolic approaches to automatic integration are too restrictive when independent third-party services are concerned. Flexibility without human intervention is beyond their capabilities. Encouraged by recent developments in the field of connectionism (e.g., Deep Learning), we adhere to the chosen research venue. We see it as part of a new paradigm of operating on large vectors (i.e., connectionism) to replace rule-based manipulation of symbols.