baguette's avatar
baguette

Aug. 19, 2023

0
Le traitement automatique du langage naturel

Récemment j'ai commencé à m'intéresser au sujet du traitement automatique du langage naturel (natural language processing ou NLP en anglais) et je veux comprendre la base de cette technologie qui me semble se met au jour extrêmement rapidement. L'un des sujets sur lequel j'ai lu est un mécanisme qui est bien nommé Attention.

Il s'agit d'une relativement nouvelle technique qui était inventée en 2016 et qui est souvent utilisé maintenant pour les tâches de traduction. L'idée générale n'est pas trop énigmatique : après avoir appris un grand nombre d'exemples, un réseau neuronal artificiel comprend comment faire plus d'attention à un ou plusieurs mots spécifiques de l'entrée chaque fois qu'il génère un mot de la traduction. Par exemple, s'il devait traduire « I went to the park » en français, pour le premier mot de la traduction, il ferait le plus d'attention au mot « I » et il donc créerait le mot « Je » ; mais pour les mots suivants de la traduction (« suis » et « allé »), il ferait plus d'attention à tous les deux « I » et « went » parce qu'ils sont tous importants pour déterminer le verbe et sa conjugaison correcte en français. Grâce à cette sensibilité au contexte, il est capable de traduire plus précisément et de manière plus flexible. Bien sûr, c'est une explication simpliste et si vous êtes spécialiste dans ce domaine, n'hésitez pas à me corriger si j'ai fait des erreurs !

Cela a vraiment du sens en fait, parce que je constate que des traducteurs automatiques, en particulier Google Translate, sont devenus beaucoup mieux après 2016 environ. En effet, Google utilise le mécanisme Attention pour ce produit.

Corrections

Le traitement automatique du langage naturel

Récemment j'ai commencé à m'intéresser au sujet du traitement automatique du langage naturel (n« Natural lLanguage pProcessing » ou NLP en anglais) et je veux comprendre la base de cette technologie qui, il me semble, se met auà jour extrêmement rapidement.

You have caps in the original English acronym so you can keep them
You'd have to have an interpolated clause here, because we say "il me semble", the subject wouldn't be "cette technologie"
You can, however, use "cette technologie" as a subject => cette technologie qui semble se mettre à jour extrêmement rapidement

L'un des sujets sur lequel j'ai lu est un mécanisme qui est bien nomméau nom approprié, « Attention ».

Il s'agit d'une technique relativement nouvelle technique qui étaitqui a été inventée en 2016 et qui est désormais souvent utilisé maintenante pour les tâches de traduction.

qui était inventée = which was in the state of being invented
qui a été inventée = which "got invented" (the action happened at that moment)
désormais = from now/then on
"pour les travaux de traduction" would sound a bit more natural

L'idée générale n'est pas trop énigmatiquobscure : après avoir appris un grand nombre d'exemples, un réseau neuronal artificiel comprend comment faire plus d'attention à un ou plusieurs mots spécifiques d'une l'entrée chaque fois qu'il génère un mot de la traduction.

Par exemple, s'il devaoit traduire « I went to the park » en français, pour le premier mot de la traduction, il ferait le plus d'attention ause concentrera surtout sur le mot « I » et il va donc créerait/donner le mot « Je » ;, mais pour les mots suivants (de la traduction) (« suis » et « allé »), il feraitva faire plus d'attention à tous les deux « I » et « went » parce qu'ils sont tous les deux importants pour déterminer le verbe et sa conjugaison correcte en français.

If A happens, B will follow (as a general rule) => present in the "si" clause, future tense in the main one
A present tense in both clauses would also be right, to express some kind of universal truth
The "imparfait/conditional" would sound off, however, since this situation isn't hypothetical (NLP techniques already do that)
faire attention À quelque chose (it's a set expression)
I'd write "tous les deux" in front of "importants". If you want to insist, you can also write => il va faire plus attention à la fois à « I » et à « went »

Grâce à cette sensibilité au contexte, il est capable de traduire plus précisément et de manière plus flexible.

"contexte" has such a broad meaning it would of course work here, but from what you're describing, the machine mostly pays attention to morphological rules, so you can write => grâce à cette sensibilité à la morphologie (propre à chaque langue) [...]

Bien sûr, c'est une explication simpliste et si vous êtes spécialiste danse ce domaine, n'hésitez pas à me corriger si j'ai fait des erreurs !

Cela a vraiment du sens, en fait, parce que je constate que dles traducteurs automatiques, en particulier Google Translate, sont devenus beaucoup mieuxien meilleurs après 2016 environ.

If you're referring to translators in general => les
"good" in quality = bon, comp. "meilleur"

En effet, Google utilise le mécanisme « Attention » pour ce produit.

It's better to use brackets for new/specialized terms that the public may not know very well

Feedback

My corrections mostly are stylistical and usage improvements, it was a nice text overall!

baguette's avatar
baguette

Aug. 21, 2023

0

Thanks a lot!

Le traitement automatique du langage naturel


This sentence has been marked as perfect!

Récemment j'ai commencé à m'intéresser au sujet du traitement automatique du langage naturel (natural language processing ou NLP en anglais) et je veux comprendre la base de cette technologie qui me semble se met au jour extrêmement rapidement.


Récemment j'ai commencé à m'intéresser au sujet du traitement automatique du langage naturel (n« Natural lLanguage pProcessing » ou NLP en anglais) et je veux comprendre la base de cette technologie qui, il me semble, se met auà jour extrêmement rapidement.

You have caps in the original English acronym so you can keep them You'd have to have an interpolated clause here, because we say "il me semble", the subject wouldn't be "cette technologie" You can, however, use "cette technologie" as a subject => cette technologie qui semble se mettre à jour extrêmement rapidement

L'un des sujets sur lequel j'ai lu est un mécanisme qui est bien nommé Attention.


L'un des sujets sur lequel j'ai lu est un mécanisme qui est bien nomméau nom approprié, « Attention ».

Il s'agit d'une relativement nouvelle technique qui était inventée en 2016 et qui est souvent utilisé maintenant pour les tâches de traduction.


Il s'agit d'une technique relativement nouvelle technique qui étaitqui a été inventée en 2016 et qui est désormais souvent utilisé maintenante pour les tâches de traduction.

qui était inventée = which was in the state of being invented qui a été inventée = which "got invented" (the action happened at that moment) désormais = from now/then on "pour les travaux de traduction" would sound a bit more natural

L'idée générale n'est pas trop énigmatique : après avoir appris un grand nombre d'exemples, un réseau neuronal artificiel comprend comment faire plus d'attention à un ou plusieurs mots spécifiques de l'entrée chaque fois qu'il génère un mot de la traduction.


L'idée générale n'est pas trop énigmatiquobscure : après avoir appris un grand nombre d'exemples, un réseau neuronal artificiel comprend comment faire plus d'attention à un ou plusieurs mots spécifiques d'une l'entrée chaque fois qu'il génère un mot de la traduction.

Par exemple, s'il devait traduire « I went to the park » en français, pour le premier mot de la traduction, il ferait le plus d'attention au mot « I » et il donc créerait le mot « Je » ; mais pour les mots suivants de la traduction (« suis » et « allé »), il ferait plus d'attention à tous les deux « I » et « went » parce qu'ils sont tous importants pour déterminer le verbe et sa conjugaison correcte en français.


Par exemple, s'il devaoit traduire « I went to the park » en français, pour le premier mot de la traduction, il ferait le plus d'attention ause concentrera surtout sur le mot « I » et il va donc créerait/donner le mot « Je » ;, mais pour les mots suivants (de la traduction) (« suis » et « allé »), il feraitva faire plus d'attention à tous les deux « I » et « went » parce qu'ils sont tous les deux importants pour déterminer le verbe et sa conjugaison correcte en français.

If A happens, B will follow (as a general rule) => present in the "si" clause, future tense in the main one A present tense in both clauses would also be right, to express some kind of universal truth The "imparfait/conditional" would sound off, however, since this situation isn't hypothetical (NLP techniques already do that) faire attention À quelque chose (it's a set expression) I'd write "tous les deux" in front of "importants". If you want to insist, you can also write => il va faire plus attention à la fois à « I » et à « went »

Grâce à cette sensibilité au contexte, il est capable de traduire plus précisément et de manière plus flexible.


Grâce à cette sensibilité au contexte, il est capable de traduire plus précisément et de manière plus flexible.

"contexte" has such a broad meaning it would of course work here, but from what you're describing, the machine mostly pays attention to morphological rules, so you can write => grâce à cette sensibilité à la morphologie (propre à chaque langue) [...]

Bien sûr, c'est une explication simpliste et si vous êtes spécialiste dans ce domaine, n'hésitez pas à me corriger si j'ai fait des erreurs !


Bien sûr, c'est une explication simpliste et si vous êtes spécialiste danse ce domaine, n'hésitez pas à me corriger si j'ai fait des erreurs !

Cela a vraiment du sens en fait, parce que je constate que des traducteurs automatiques, en particulier Google Translate, sont devenus beaucoup mieux après 2016 environ.


Cela a vraiment du sens, en fait, parce que je constate que dles traducteurs automatiques, en particulier Google Translate, sont devenus beaucoup mieuxien meilleurs après 2016 environ.

If you're referring to translators in general => les "good" in quality = bon, comp. "meilleur"

En effet, Google utilise le mécanisme Attention pour ce produit.


En effet, Google utilise le mécanisme « Attention » pour ce produit.

It's better to use brackets for new/specialized terms that the public may not know very well

You need LangCorrect Premium to access this feature.

Go Premium