https://codereview.appspot.com/238530043/diff/1/main.py File main.py (right): https://codereview.appspot.com/238530043/diff/1/main.py#newcode117 main.py:117: tokens = tokenize(line, numbers=numbers, punctuation=punctuation) Я бы рекомендовал сделать, ...
8 years, 11 months ago
(2015-05-30 16:29:23 UTC)
#3
https://codereview.appspot.com/238530043/diff/1/main.py
File main.py (right):
https://codereview.appspot.com/238530043/diff/1/main.py#newcode117
main.py:117: tokens = tokenize(line, numbers=numbers, punctuation=punctuation)
Я бы рекомендовал сделать, чтобы эта функция сразу получала на вход
правильно отфильтрованный список/генератор токенов, а не сама их
делала/фильтровала (возможно, в зависимости от сложных опций).
Тогда, если нужно будет использовать эту функцию в новой задаче, ее не
придется переделывать.
https://codereview.appspot.com/238530043/diff/1/main.py#newcode164
main.py:164: probabilities = calculate_probabilities(text, depth,
case_sensitive,
Не очень хорошо, что функция обучения модели (сбора вероятностей) находится
прямо в функции генерации. Для того, чтобы сгенерировать несколько текстов на
основе одной модели, придется каждый раз заново обучать ее. Лучше разделить эти
действия. Еще можно для хранения модели сделать класс.
Issue 238530043: ShadPython - 2 - Fabarisov Dmitriy - AD
Created 8 years, 11 months ago by brain2805
Modified 8 years, 11 months ago
Reviewers: shad.python
Base URL:
Comments: 2