RLI RBL ROSETTE Language Identifier Des langues triée ROSETTE Base Linguistics Une recherche a www.basistech.com [email protected] +1 617-386-2090 REX ROSETTE Entity Extractor Améliorez la vitesse et la RES Verbe ROSETTE Entity Resolver Déterminant Nom Conjonction Déterminant Noms des entité Real Identities précision de votre logiciel RNI ROSETTE Nom Name Indexer Préposition Déterminant Concordance de Nom de recherche avec l' analyse Name Translator Noms traduits RNT Préposition ROSETTE Nom Préposition Déterminant Nom linguistique avancée . Categorizer RCA ROSETTE Adjectif Adjectif RSA ROSETTE Sentiment Lancez des Analyzer recherches multilingues extrêmement précises Chaque langue, y compris l'anglais, présente des challenges uniques et complexes pour les logiciels de recherche visant à fournir des résultats pertinents et précis. Rosette® Base Linguistics (RBL) permet aux logiciels d'entreprise de chercher ou traiter du texte rédigé en de nombreuses langues efficacement et en fournissant un ensemble complet de services linguistiques. RBL enrichit le texte dans sa langue d'origine pour un meilleur traitement de langue naturelle, ce qui améliore la vitesse et la précision. Spécialiste de la linguistique avec une expertise poussée à l'intersection des langues et des logiciels, Basis Technology améliore continuellement sa gamme de produits Rosette avec des mises à jour régulières, en ajoutant des langues, des fonctionnalités et les dernières innovations du monde académique. Sorted Content Ponctuation 40 Actionable Insigh Langues prises en charge P RINCIPALES F ONCTION N A LITÉS - API simple - Grande échelle et haut rendement - Assistance professionnelle - Installation facile - À la fois souple et personnalisable - Intégration : Java, C++ ou Services Web - Plateforme : Unix, Linux, Mac ou Windows - Composant du kit de développement Rosette - Fonctions personnalisables comme les dictionnaires utilisateurs, la normalisation de l'orthographe et la conversion des systèmes d'écriture Nos clients Essayez RBL dès aujourd'hui Version d'évaluation gratuite www.basistech.com t RLI ROSETTE Language Identifier RBL Des langues triées ROSETTE Base Linguistics Une recherche améliorée Fonctionnalités morphologiques avancées REX ROSETTE Entity Extractor Noms des entités Language Identifier LEMMATISATION DÉCOMPOSITION RLI Identifiez les langues et les codages de SEGMENTATION EN UNITÉS RES caractères ROSETTE Entity Resolver Beaucoup d'outils de recherche utilisent des bigrammes pour comprendre les langues qui s'écrivent sans espace entre les mots. Cela entraîne ROSETTE une augmentation de la taille de l'index et une réduction de la pertinence des résultats. RBL, au contraire, identifie et sépare précisément chaque mot grâce à une modélisation statistique avancée. La production d'unités qui en résulte (également appelée « tokénisation ») ROSETTE minimise la taille de l'index, améliore la précision de la recherche et augmente la pertinence. Name Indexer ROSETTE RCA Exemple : Chinois Categorizer Prenez le problème de l'indexation de « Département RES de Biologie de l'Université de Beijing » et une recherche subséquente de « étudiant »: RSA INDEX ROSETTE SentimentRECHERCHE Analyzer 学 Université de Beijing Département de Biologie 2 Beijing 2 3 3 4 4 5 (non-mot) Université (étudiant) 5 6 Département de Biologie 6 7 RNT (non-mot) TOKÉNISATION MORPHOLOGIQUE DE RBL 2 Département de Biologie PARTIES DU DISCOURS Make real-world connections in your data Pronom Verbe Adjectif Nom Name Indexer animals animated anim la nature grammaticale, même avec des mots ambigus. Chaque unité est ensuite marquée par noms entre des mots-clés pour améliorer la compréhension et la pertinence des résultats de recherche. RNI animal animate EXTRACTION DE GROUPES NOMINAUX Traduisez des noms étrangers en anglais La recherche de radical peut produire des résultats inattendus. RSA several sever several spoke (n.) RNT Certains noms, particulièrement les noms propres, peuvent se révéler très complexes à identifier en tant qu'entité unique. RBL regroupe les noms et leurs modificateurs, ce qui est utile pour le regroupement de documents et l'extraction de concepts. Plateformes compatibles RCA RSA début et la fin de chaque phrase sont Detect The Sentiments Of YourLe Text automatiquement identifiés même en cas de ponctuation ambiguë. EUROPE DE L'OUEST EUROPE DE L'EST MOYEN-ORIENT ASIE - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Catalan* Tchèque Danois Néerlandais Anglais Finnois* Français Allemand Grec Italien Norvégien Portugais Espagnol Suédois Albanais* Bulgare* Croate* Estonien* Hongrois Letton* Polonais Roumain Russe Serbe* Slovaque* Slovène* Turc Ukrainien* Arabe Hébreu Pachto Persan Ourdou Chinois simplifié Chinois traditionnel Indonésien Japonais Coréen Malais* Thaï * Prise en charge limitée © 2015 Basis Technology Corporation. « Basis Technology Corporation » , « Rosette » et « Highlight » sont des marques déposées de Basis Technology Corporation. « Big Text Analytics » est une marque déposées de Basis Technology Corporation. Toutes les autres marques commerciales, marques de service et logos utilisés dans ce document appartiennent à leurs propriétaires respectifs. (2014-12-16-RBL) Base ROSETT Entit ROSETT Entit ROSETT Nam ROSETT Nam ROSETT Cate DÉTECTION DE PHRASE Sentiment Analyzer Langues disponibles Compatibilité RES ROSETT Dans le cadre du processus de lemmatisation, on Name Translator noms irréguliers peuvent induire la recherche en erreur. Moteurs de recherche Lang la modélisation statistique pour déterminer Actionableutilise Insights Categorizer Compatibilité Base de code Entity Resolver Sorted Content RCA Everything In Sight Les verbesCategorize et les spoke spoke speak (v.) Ignore correctement « Département de Biologie de l'Université de Beijing ». 学 Université de Beijing REX Noms traduits Deux mots sans aucun rapport peuvent partager un radical. « Etudiant » donne de façon erronée « Département de Biologie de l'Université de Beijing ». 1 Entity Extractor Assurez la concordance des CHALLENGE QUERY STEM LEMMA leurs nombreuses variantes (étudiant) AVEC LES BIGRAMMES 1 RBL Exemple : Anglais L'analyse linguistique est utile dans toutes les langues ; en anglais, la lemmatisation améliore les concordances et la précision. RNI 学 Base Linguistics Concordance des identités Name Translator REX RNT ROSETT Real Identities La plupart des moteurs de recherche utilisent RBL divise les mots composés en sous-composants une méthode un peu grossière qui consiste à et fournit chaque élément individuel à indexer. supprimer les caractères situés à la fin d'un mot Cette fonctionnalité est particulièrement utile pour en espérantLancez supprimerdes des différences sans multilingues améliorer la pertinence des résultats de recherche recherches importance. Cette méthode, appelée recherche dans des langues comme l'allemand et le coréen. extrêmement précises du radical, entraîne souvent des concordances indésirables et une précision plutôt faible. RBL au Exemple : Allemand contraire retrouve la véritable forme de chaque Samstagmorgen est un mot composé formé mot dans le dictionnaire (appelée un lemme) en de Samstag (samedi) et morgen (matin). La utilisant une analyse morphologique avancée, une décomposition permet une correspondance Ajoutez lesvocabulaire. noms de personnes, de lieux et analyse du contexte et du L'indexation adéquate lors d'une recherche sur « Samstag ». du radical améliore la pertinence des de d'organisations enrésultats mots-clés recherche et dégraisse l'index de recherche en ne répertoriant pas toutes les inflexions de chaque radical. Des lemmes alternatifs sont également mis AJOUT DE MOTS-CLÉS AUX à disposition pour compléter l'indexation. RBL RNI RLI SIÈGE SOCIAL NIVEAU FÉDÉRAL DES É.-U. CÔTE OUEST DES É.-U. One Alewife Center Cambridge, MA 02140, États-Unis 2553 Dulles View Dr. Suite 450 Herndon, VA 20171, États-Unis 1700 Montgomery St. Furzeground Way San Francisco, CA Middlesex UB11 1BD, 94111, États-Unis Royaume-Uni EUROPE ASIE 9-6 Nibancho, Chiyoda-ku Tokyo 102-0084, Japon ROSETT Sent