Modèle de traduction

Postat

Bonjour Monsieur, vous utilisez les données de test comme données de validation. Cela signifie que le modèle a vu des données de test uniquement pendant la phase d`entraînement. Je pense que les données d`essai sont conservées séparées. J`ai raison?? Si oui s`il vous plaît expliquer la logique derrière elle. Nous devons limiter le nombre de mots que nous modélisons, il ne peut pas être illimité, du moins dans la façon dont je choisis de modéliser le problème. Comment résoudre le problème? J`ai essayé de ré-exécuter le modèle depuis le début à nouveau. Il montre le même résultat. Nous sommes maintenant prêts à commencer à développer notre modèle de traduction. Le score de la sous-étude d`évaluation bilingue, ou score BLEU, fait référence à une mesure d`évaluation aux fins d`évaluer les systèmes de traduction automatique en comparant une phrase générée à une phrase de référence. La fonction evaluate_model () ci-dessous implémente ceci, en appelant la fonction predict_sequence () ci-dessus pour chaque expression dans un DataSet fourni. Le plus petit nombre d`échantillons peut signifier que le modèle peut surajuster rapidement, vous pouvez essayer de limiter cela avec la régularisation. Renvoyé à votre article https://machinelearningmastery.com/check-point-deep-learning-models-keras/et compris que, avant de compiler le modèle à l`aide de Model.

Compile (), je dois charger le modèle à partir du fichier, pour utiliser le modèle existant comme point de départ dans Formation. Nous devons nous assurer que les données sont la forme correcte qui est attendue par le modèle, par exemple 2D pour MLPs, 3D pour LSTMs, etc Hey je veux savoir une chose que si nous donnons l`anglais aux traductions allemandes au modèle de formation 9000 et pour les tests 1000.. alors quel est le modèle de décodeur codeur est en fait.. que nous donnons tout au modèle au moment de l`essai. Exécutez la commande suivante pour prétraiter les données de formation et de validation et extraire des fonctionnalités pour la formation et générer des fichiers de vocabulaire pour le modèle. Salut, je veux savoir pourquoi vous utilisez Model. Add (RepeatVector (tar_timesteps))? Nous pouvons utiliser la classe keras tokenize pour mapper des mots à des entiers, selon les besoins pour la modélisation. Nous utiliserons un tokenizer distinct pour les séquences anglaises et les séquences allemandes.

La fonction ci-dessous nommée create_tokenizer () entraîne un tokenizer sur une liste de phrases. prédiction = Model. prédire (source, verbose = 0) [0] fichier ”C:Program Files (x86) Microsoft Visual StudioSharedPython36_64libsi te-packageskerasenginetraining.py”, ligne 1149, dans prédire x, _, _ = self. _ standarze_user_data (x) file ”c: Program Files Files (x86) Microsoft Visual StudioSharedPython36_64libsi te-packageskerasenginetraining.py ”, ligne 751, dans _ standarze_user_data exception_prefix = `input`) fichier” C:Program Files (x86) Microsoft Visual StudioSharedPython36_64lib Si te-packageskerasenginetraining_utils.py ”, ligne 138, en standardize_input_data combien de temps faut-il pour imprimer le score bleu? En fait, cette partie du code ne fonctionne pas pour moi et son pas imprimer le score bleu et encore une fois quand j`essaie de tracer le modèle, il montre installer graphviz mais j`ai déjà que.