Améliorez la vitesse et la précision de votre

publicité
RLI
RBL
ROSETTE
Language Identifier
Des langues triée
ROSETTE
Base Linguistics
Une
recherche a
www.basistech.com
[email protected]
+1 617-386-2090
REX
ROSETTE
Entity Extractor
Améliorez la vitesse et la
RES
Verbe
ROSETTE
Entity Resolver
Déterminant
Nom
Conjonction
Déterminant
Noms des entité
Real Identities
précision
de
votre
logiciel
RNI
ROSETTE
Nom
Name Indexer
Préposition
Déterminant
Concordance de
Nom
de recherche
avec
l'
analyse
Name Translator
Noms traduits
RNT
Préposition
ROSETTE
Nom
Préposition
Déterminant Nom
linguistique
avancée .
Categorizer
RCA
ROSETTE
Adjectif
Adjectif
RSA
ROSETTE
Sentiment
Lancez
des Analyzer
recherches multilingues
extrêmement précises
Chaque langue, y compris l'anglais, présente des challenges uniques et
complexes pour les logiciels de recherche visant à fournir des résultats pertinents
et précis. Rosette® Base Linguistics (RBL) permet aux logiciels d'entreprise de
chercher ou traiter du texte rédigé en de nombreuses langues efficacement et en
fournissant un ensemble complet de services linguistiques. RBL enrichit le texte
dans sa langue d'origine pour un meilleur traitement de langue naturelle, ce qui
améliore la vitesse et la précision.
Spécialiste de la linguistique avec une expertise poussée à l'intersection des
langues et des logiciels, Basis Technology améliore continuellement sa gamme
de produits Rosette avec des mises à jour régulières, en ajoutant des langues, des
fonctionnalités et les dernières innovations du monde académique.
Sorted Content
Ponctuation
40
Actionable Insigh
Langues prises
en charge
P RINCIPALES F ONCTION N A LITÉS
- API simple
- Grande échelle et haut rendement
- Assistance professionnelle
- Installation facile
- À la fois souple et personnalisable
- Intégration : Java, C++ ou Services Web
- Plateforme : Unix, Linux, Mac ou Windows
- Composant du kit de développement Rosette
- Fonctions personnalisables comme les
dictionnaires utilisateurs, la normalisation
de l'orthographe et la conversion des
systèmes d'écriture
Nos clients
Essayez RBL dès aujourd'hui
Version d'évaluation gratuite
www.basistech.com
t
RLI
ROSETTE
Language Identifier
RBL
Des langues triées
ROSETTE
Base Linguistics
Une recherche améliorée
Fonctionnalités
morphologiques avancées
REX ROSETTE
Entity Extractor
Noms des entités
Language Identifier
LEMMATISATION
DÉCOMPOSITION
RLI
Identifiez les langues et les codages de
SEGMENTATION EN UNITÉS
RES
caractères
ROSETTE
Entity Resolver
Beaucoup d'outils de recherche utilisent des
bigrammes pour comprendre les langues qui
s'écrivent sans espace entre les mots.
Cela entraîne ROSETTE
une augmentation de la taille de
l'index et une réduction de la pertinence des
résultats. RBL, au contraire, identifie et sépare
précisément chaque mot grâce à une modélisation
statistique avancée. La production d'unités qui
en résulte (également appelée « tokénisation »)
ROSETTE
minimise la taille de l'index, améliore la précision de
la recherche et augmente la pertinence.
Name Indexer
ROSETTE
RCA
Exemple : Chinois
Categorizer
Prenez le problème de l'indexation de « Département
RES
de Biologie de l'Université de Beijing » et une
recherche subséquente de « étudiant »:
RSA
INDEX
ROSETTE
SentimentRECHERCHE
Analyzer
学
Université
de Beijing
Département
de Biologie
2
Beijing
2
3
3
4
4
5
(non-mot) Université (étudiant)
5
6
Département
de Biologie
6
7
RNT
(non-mot)
TOKÉNISATION MORPHOLOGIQUE DE RBL
2
Département de Biologie
PARTIES DU DISCOURS
Make real-world connections in your data
Pronom Verbe Adjectif Nom
Name Indexer
animals
animated
anim
la nature grammaticale, même avec des mots
ambigus. Chaque unité est ensuite marquée par
noms
entre
des mots-clés
pour améliorer la compréhension et
la pertinence des résultats de recherche.
RNI
animal
animate
EXTRACTION DE GROUPES
NOMINAUX
Traduisez des noms étrangers en anglais
La recherche de
radical peut produire
des résultats
inattendus.
RSA
several
sever
several
spoke (n.)
RNT
Certains noms, particulièrement les noms propres,
peuvent se révéler très complexes à identifier en
tant qu'entité unique. RBL regroupe les noms et leurs
modificateurs, ce qui est utile pour le regroupement
de documents et l'extraction de concepts.
Plateformes compatibles
RCA
RSA
début et la fin de chaque phrase sont
Detect The Sentiments Of YourLe
Text
automatiquement identifiés même en cas de
ponctuation ambiguë.
EUROPE DE L'OUEST
EUROPE DE L'EST
MOYEN-ORIENT
ASIE
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
Catalan*
Tchèque
Danois
Néerlandais
Anglais
Finnois*
Français
Allemand
Grec
Italien
Norvégien
Portugais
Espagnol
Suédois
Albanais*
Bulgare*
Croate*
Estonien*
Hongrois
Letton*
Polonais
Roumain
Russe
Serbe*
Slovaque*
Slovène*
Turc
Ukrainien*
Arabe
Hébreu
Pachto
Persan
Ourdou
Chinois simplifié
Chinois traditionnel
Indonésien
Japonais
Coréen
Malais*
Thaï
* Prise en charge limitée
© 2015 Basis Technology Corporation. « Basis Technology Corporation
» , « Rosette » et « Highlight » sont des marques déposées de Basis
Technology Corporation. « Big Text Analytics » est une marque
déposées de Basis Technology Corporation. Toutes les autres marques
commerciales, marques de service et logos utilisés dans ce document
appartiennent à leurs propriétaires respectifs. (2014-12-16-RBL)
Base
ROSETT
Entit
ROSETT
Entit
ROSETT
Nam
ROSETT
Nam
ROSETT
Cate
DÉTECTION DE PHRASE
Sentiment Analyzer
Langues disponibles
Compatibilité
RES
ROSETT
Dans le cadre du processus de lemmatisation, on
Name Translator
noms irréguliers
peuvent induire la
recherche en erreur.
Moteurs de recherche
Lang
la modélisation statistique pour déterminer
Actionableutilise
Insights
Categorizer
Compatibilité
Base de code
Entity Resolver
Sorted Content
RCA
Everything
In Sight
Les verbesCategorize
et les
spoke
spoke speak
(v.)
Ignore correctement
« Département de
Biologie de l'Université
de Beijing ».
学
Université de Beijing
REX
Noms traduits
Deux mots sans
aucun rapport
peuvent partager
un radical.
« Etudiant » donne de façon erronée « Département de Biologie de
l'Université de Beijing ».
1
Entity Extractor
Assurez la concordance des
CHALLENGE
QUERY STEM
LEMMA
leurs nombreuses
variantes
(étudiant)
AVEC LES BIGRAMMES
1
RBL
Exemple : Anglais
L'analyse linguistique est utile dans toutes les
langues ; en anglais, la lemmatisation améliore
les concordances et la précision.
RNI
学
Base Linguistics
Concordance des identités
Name Translator REX
RNT
ROSETT
Real Identities
La plupart des moteurs de recherche utilisent
RBL divise les mots composés en sous-composants
une méthode un peu grossière qui consiste à
et fournit chaque élément individuel à indexer.
supprimer les caractères situés à la fin d'un mot
Cette fonctionnalité est particulièrement utile pour
en espérantLancez
supprimerdes
des différences
sans multilingues
améliorer la pertinence des résultats de recherche
recherches
importance. Cette méthode, appelée recherche
dans des langues comme l'allemand et le coréen.
extrêmement
précises
du radical, entraîne souvent des concordances
indésirables et une précision plutôt faible. RBL au
Exemple : Allemand
contraire retrouve la véritable forme de chaque
Samstagmorgen est un mot composé formé
mot dans le dictionnaire (appelée un lemme) en
de Samstag (samedi) et morgen (matin). La
utilisant une analyse morphologique avancée, une
décomposition permet une correspondance
Ajoutez
lesvocabulaire.
noms de
personnes,
de lieux et
analyse du contexte
et du
L'indexation
adéquate lors d'une recherche sur « Samstag ».
du radical améliore
la pertinence des
de
d'organisations
enrésultats
mots-clés
recherche et dégraisse l'index de recherche en ne
répertoriant pas toutes les inflexions de chaque
radical. Des lemmes alternatifs sont également mis
AJOUT DE MOTS-CLÉS AUX
à disposition pour compléter l'indexation.
RBL
RNI
RLI
SIÈGE SOCIAL
NIVEAU FÉDÉRAL DES É.-U.
CÔTE OUEST DES É.-U.
One Alewife Center
Cambridge, MA
02140, États-Unis
2553 Dulles View Dr.
Suite 450
Herndon, VA
20171, États-Unis
1700 Montgomery St. Furzeground Way
San Francisco, CA
Middlesex UB11 1BD,
94111, États-Unis
Royaume-Uni
EUROPE
ASIE
9-6 Nibancho,
Chiyoda-ku
Tokyo 102-0084,
Japon
ROSETT
Sent
Téléchargement