Rietveld Code Review Tool
Help | Bug tracker | Discussion group | Source code | Sign in
(13342)

Issue 238530043: ShadPython - 2 - Fabarisov Dmitriy - AD

Can't Edit
Can't Publish+Mail
Start Review
Created:
8 years, 11 months ago by brain2805
Modified:
8 years, 11 months ago
Reviewers:
shad.python
Visibility:
Public.

Patch Set 1 #

Total comments: 2
Unified diffs Side-by-side diffs Delta from patch set Stats (+1 line, -0 lines) Patch
M main.py View 1 chunk +1 line, -0 lines 2 comments Download

Messages

Total messages: 3
brain2805
Совершенно забыл про ревью, поэтому отправляю так поздно.
8 years, 11 months ago (2015-05-24 22:42:11 UTC) #1
brain2805
8 years, 11 months ago (2015-05-24 22:43:23 UTC) #2
shad.python
8 years, 11 months ago (2015-05-30 16:29:23 UTC) #3
https://codereview.appspot.com/238530043/diff/1/main.py
File main.py (right):

https://codereview.appspot.com/238530043/diff/1/main.py#newcode117
main.py:117: tokens = tokenize(line, numbers=numbers, punctuation=punctuation)
Я бы рекомендовал сделать, чтобы эта функция сразу получала на вход
правильно отфильтрованный список/генератор токенов, а не сама их
делала/фильтровала (возможно, в зависимости от сложных опций).
Тогда, если нужно будет использовать эту функцию в новой задаче, ее не
придется переделывать.

https://codereview.appspot.com/238530043/diff/1/main.py#newcode164
main.py:164: probabilities = calculate_probabilities(text, depth,
case_sensitive,
Не очень хорошо, что функция обучения модели (сбора вероятностей) находится
прямо в функции генерации. Для того, чтобы сгенерировать несколько текстов на
основе одной модели, придется каждый раз заново обучать ее. Лучше разделить эти
действия. Еще можно для хранения модели сделать класс.
Sign in to reply to this message.

Powered by Google App Engine
RSS Feeds Recent Issues | This issue
This is Rietveld f62528b