Exemple q de corpus

Nous pensons que la méthode a bien fonctionné parce que le mot anglais “parce que” était moins ambigu que les mots japonais comme “” (parce que, de) et “” (parce que, pour). La première méthode concerne l`extension de requête dans le module de récupération de document pertinent. Les documents ont été récupérés à partir du Web deux fois pour le système avec l`extension de requête: à l`aide de tous les mots de contenu et en utilisant tous les mots de contenu et tous les nouveaux mots pour l`expansion des requêtes. Tous les auteurs lisent et approuvent le manuscrit final. Ici, chaque mot a été choisi pour chaque combinaison de deux mots en question pour le système de la méthode proposée. Exemple A quelques exemples où le nouveau mot trouvé était la réponse à la question pourrait être trouvé. Lorsqu`une question écrite en langage naturel est entrée dans le système, le système effectue l`extraction des mots clés dans le module d`analyse des questions. Répondre aux questions (QA) est une tâche qui consiste à répondre à une question de langage naturel avec des phrases adéquates. Derczynski et coll. Pour l`expansion de la requête, certains chercheurs comme Higashinaka et Isozaki (2007, 2008) et Isozaki et Higashinaka (2008) ont rapporté que la performance du système s`est améliorée lorsque les types de questions ont été classés dans des classes telles que «comment-questions» et « Pourquoi-questions “à l`avance. Nous nous attendions à ce que (13) “” (parce que), (14) “” (parce que, à partir de), et (15) “” (parce que, pour) étaient susceptibles de co-se produire avec “” (pourquoi) ou “” (pourquoi), qui est souvent apparu dans les questions, parce qu`ils sont souvent apparus dans les réponses de La précision du Top 5 a été maximisée à 0.

Les expériences ont été réalisées à l`aide d`un corpus de site Q&A japonais. Cela indique que les mots dans les questions ont tendance à apparaître dans leurs réponses. Chiebukuro “les données sont des exemples de Q&A site soumis du 1er avril 2004 au 31 octobre 2005. C`était le mot qui maximisait l`information mutuelle entre le mot d`interrogation et le mot de réponse lui-même. Performance de la méthode proposée. Nous avons proposé la méthode pour évaluer les réponses des candidats en utilisant deux méthodes existantes, i. Ensuite, les trois premiers mots au maximum sont choisis dans l`ordre des informations mutuelles comme les mots à ajouter pour l`expansion de la requête. Score de pertinence du site Web et probabilité de traduction. L`extension de requête est une approche pour étendre les mots de requête en ajoutant de nouveaux mots qui ne sont pas inclus dans chaque question pour améliorer les qualités des documents pertinents à être récupérées. Nous pourrions particulièrement obtenir Pékin, qui était lié à la fois 2008 et olympique, bien que nous pouvions difficilement obtenir ces mots par l`intermédiaire de la méthode utilisant seulement la probabilité de traduction qui peut seulement prendre en considération un mot à la fois.

Ils considéraient les mots qui apparaissaient fréquemment dans les documents récupérés pour chaque interrogation de question comme les nouveaux mots pour l`expansion de la requête. Soricut et Brill 2006) et la deuxième méthode proposée pour le module. Soricut et Brill (2006), qui ont utilisé un corpus anglais de Q&A pour apprendre, ont rapporté que «parce que» ont tendance à être traduits en «pourquoi». Dans l`équation (10), il y a un problème où le moins le nombre de mots dans une réponse de candidat devient, plus sa probabilité de traduction augmente parce que la valeur du coefficient augmente comme l diminue. Tout d`abord, les mots ont été choisis parmi les réponses d`un corpus q & a comme candidats à l`expansion de la requête. Des réponses directes pouvaient être obtenues lorsque la question était Factoid, comme le montre l`exemple D. Il y avait beaucoup de cas comme eux lorsque des mots généraux ont été utilisés pour le calcul de l`information mutuelle.