Faculté des sciences économiques et sociales

Modeling latent variables in economics and finance

Bluteau, Keven ; Ardia, David (Dir.) ; Boudt, Kris (Codir.)

Thèse de doctorat : Université de Neuchâtel, 2019 ; 2758.

The subject of unobservable variables encompasses this thesis. These latent (i.e., unobservable) variables must be inferred using statistical models or observable proxies. The objectives of my doctoral thesis are to develop and test new statistical models to infer these variables and link them to the analysis and improvement of economic and financial decisions. In my first essay, I tackle... More

Add to personal list
    Résumé
    Le sujet des variables latentes est au cœur de cette thèse. Ces variables latentes (i.e., non observables) doivent être inférées à l’aide de modèles statistiques ou de variables proxys observables. Les objectifs de ma thèse de doctorat sont de développer et de tester de nouveaux modèles statistiques pour déduire ces variables afin de les utiliser pour l’amélioration des décisions économiques et financières.
    Dans mon premier chapitre de thèses, je traite de l’évaluation des modèles de volatilité qui intègre de possible changement (latent) structurels dans les paramètres du modèle. Il est d’une importance capitale de capturer ces changements structurels rapidement, comme une mesure précise de la volatilité est cruciale pour la prise optimale de décision qui nécessite un compromis entre le rendement prévu et le risque, ainsi que pour des applications dans l’évaluation des prix d’actifs et en gestion des risques. Cependant, aucune étude empirique n’a été réalisée pour évaluer la performance globale de modèles de volatilité qui prennent en compte les changements structurels. À cette fin, j’entreprends une étude à grande échelle empirique pour comparer la` performance de prévision de modèle GARCH sans changement de régime et de modèle GARCH à changement de régimes Markovien (MSGARCH) du point de vue d’un gestionnaire des risques. Les résultats indiquent que, pour tous les horizons de prédictions considérées, les modèles MSGARCH génère des prédictions plus précises de la Value-at-Risk, d’Expected Shortfall et de la densité que les modèles GARCH sans changement de régime. De plus, mes résultats indiquent que la prise en compte de l’incertitude des paramètres améliore les prévisions de la densité, indépendamment de l’inclusion du mécanisme Markovien.
    Tandis que mon premier chapitre de thèses à une emphase sur la modélisation de variables latentes d’un point de vue de la modélisation statistique, le second et troisième chapitre tentent de capturer une variable plus originale : le sentiment exprimé dans les communications écrites.
    Mon deuxième chapitre de thèses fait face au développement et l’évaluation de nouveau proxy de sentiment économique basé sur des documents textuels. Spécifiquement, j’introduis une infrastructure générale de développement d’indices de sentiment qui sont optimisés avec l’objectif de faire de la prédiction dans un contexte de régression à grande dimension. J’applique cette nouvelle méthodologie à la prédiction de la production industrielle américaine. Mes résultats indiquent que, comparé à l’utilisation unique de variables économiques et financières, l’ajout de l’utilisation d’indices de sentiments textuelles économiques optimisés ajoute de manière importante au pouvoir de prédiction de la croissance économique américaine pour des horizons de neuf mois et un an.
    Mon troisième chapitre de thèses à comme emphase l’analyse de la dynamique de sentiment textuelles anormaux près d’évènement financier. J’introduis, en autre, l’analyse d’évènement basé sur le sentiment anormal cumulatif et le Generalized Word Power, une méthode de calcul du sentiment. J’applique ces méthodologies sur des articles médiatiques provenant de journaux, du web et de fil de presse qui discutent des entreprises publiques non-financières près de l’annonce des résultats trimestriels. Les résultats indiquent que le sentiment anormal est plus sensible aux surprises de bénéfices négatives qu’aux surprises de bénéfices positives. De plus, je note que les investisseurs ont une réaction trop forte à la contribution au sentiment anormal des articles provenant du web. Cela, en autre, fait en sorte que l’on observe un inversement du prix de l’action après l’annonce des bénéfices pour le mois qui suit les annonces. Les résultats sont conformes avec des évidences dans le domaine de la psychologie humaine telle que le biais heuristique de représentation. De plus, les résultats mettent en évidence qu’il y a de l’hétérogénéité dans la valeur de l’information de différents types de médias.
    Summary
    The subject of unobservable variables encompasses this thesis. These latent (i.e., unobservable) variables must be inferred using statistical models or observable proxies. The objectives of my doctoral thesis are to develop and test new statistical models to infer these variables and link them to the analysis and improvement of economic and financial decisions.
    In my first essay, I tackle the evaluation of volatility models which allow for (latent) structural breaks. It is of utmost importance to capture these breaks in a timely manner, as a precise measure of volatility is crucial for optimal decision–making that requires a trade–off between expected return and risk, as well as for applications in asset pricing and risk management. However, no empirical study has been done to evaluate the overall performance of volatility model considering structural breaks. To that end, I perform a large–scale empirical study to compare the forecasting performance of single–regime and Markov–switching GARCH (MSGARCH) models, from a risk management perspective. I find that, for daily, weekly, and ten–day equity log–returns, MSGARCH models yield more accurate Value–at–Risk, Expected Shortfall, and left–tail distribution forecasts than their single–regime counterpart. Also, my results indicate that accounting for parameter uncertainty improves left–tail predictions, independently of the inclusion of the Markov–switching mechanism.
    While my first essay tackles the modeling of latent variables from a statistical point of view, my second and third essay capture a more novel variable, namely the sentiment expressed in written communications.
    My second essay addresses the development and testing of new text–based proxies for economic sentiment. More specifically, I introduce a general sentiment engineering framework that optimizes the design for forecasting purposes in a high–dimensional context. I apply the new methodology to the forecasting of the US industrial production, which is usually predicted using available quantitative variables from a large panel of indicators. I find that, compared to the use of high–dimensional forecasting techniques based solely economic and financial indicators, the additional use of optimized news–based sentiment values yield significant forecasting accuracy gains for the nine–month and annual growth rates of the US industrial production.
    My third essay focuses on the analysis of the dynamics of abnormal tone or sentiment around the time of events. To do so, I introduce the Cumulative Abnormal Tone (CAT) event study and Generalized Word Power methodologies. I apply these methodologies to media reports in newswires, newspapers, and web publications about firms’ future performance published around the quarterly earnings announcements of non–financial S&P 500 firms over the period 2000–2016. I find that the abnormal tone is more sensitive to negative earnings surprises than positive ones. Additionally, I report that investors overreact to the abnormal tone contribution of web publications at earnings announcement dates, which generates a stock price reversal in the following month. This result is consistent with an overreaction pattern on the abnormal tone and psychological biases such as the representativeness heuristic. Moreover, it highlights that there is heterogeneity in the informational value of different types of media.