Issue 237480043: ShadPython - 2 - Alexander Andrianov - FIVT

Can't Edit
Can't Publish+Mail
Start Review

Created:
8 years, 11 months ago by lxndr.ndrnv

Modified:
8 years, 11 months ago

Reviewers:
shad.python

Visibility:
Public.

Patch Set 4 : textgenerator class #

Created: 8 years, 11 months ago

Download [raw] [tar.bz2]

		Unified diffs	Side-by-side diffs	Delta from patch set	Stats (+164 lines, -0 lines)			Patch
	M	textgen.py	View		1 chunk	+164 lines, -0 lines	0 comments	Download

Messages

Total messages: 5

Expand All Messages | Collapse All Messages

shad.python

https://codereview.appspot.com/237480043/diff/1/textgen.py File textgen.py (right): https://codereview.appspot.com/237480043/diff/1/textgen.py#newcode24 textgen.py:24: k = " ".join([t for t in tokens[i:i + ...

8 years, 11 months ago (2015-05-31 12:57:03 UTC) #1

lxndr.ndrnv

Вопрос по последнему комментарию https://codereview.appspot.com/237480043/diff/1/textgen.py File textgen.py (right): https://codereview.appspot.com/237480043/diff/1/textgen.py#newcode24 textgen.py:24: k = " ".join([t for ...

8 years, 11 months ago (2015-05-31 16:12:32 UTC) #2

Вопрос по последнему комментарию

https://codereview.appspot.com/237480043/diff/1/textgen.py
File textgen.py (right):

https://codereview.appspot.com/237480043/diff/1/textgen.py#newcode24
textgen.py:24: k = " ".join([t for t in tokens[i:i + depth]])
On 2015/05/31 12:57:03, shad.python wrote:
> k, v - непонятные названия, нужно придумать что-то, что описывает содержимое
> переменных

Done.

https://codereview.appspot.com/237480043/diff/1/textgen.py#newcode43
textgen.py:43: chains = [make_chains(depth, text, True) for depth in xrange(1,
max_depth+1)]
On 2015/05/31 12:57:03, shad.python wrote:
> Не очень хорошо, что функция обучения модели (сбора вероятностей) находится
> прямо в функции генерации. Для того, чтобы сгенерировать несколько текстов на
> основе одной модели, придется каждый раз заново обучать ее. Лучше разделить
эти
> действия.

Done.

https://codereview.appspot.com/237480043/diff/1/textgen.py#newcode58
textgen.py:58: sentence.append(random.choice(chains[key_length-1][key]))
On 2015/05/31 12:57:03, shad.python wrote:
> Получается, что у вас если токен 100 раз встретился после этой истории, то он
> будет 100 раз храниться в модели. Это не очень экономно по отношению к памяти,
к
> тому же модель становится менее понятной. Лучше хранить слова и их частоты.

Т.е. изначально вместо записей {начало цепи: [всевозможные окончания]}хранить
{начало: [(окончание, вероятность)]} ?

shad.python

https://codereview.appspot.com/237480043/diff/20001/textgen.py File textgen.py (right): https://codereview.appspot.com/237480043/diff/20001/textgen.py#newcode33 textgen.py:33: def get_probabilities(chains, f): Слово get здесь немного сбивает с ...

8 years, 11 months ago (2015-06-05 13:01:03 UTC) #4

lxndr.ndrnv

8 years, 11 months ago (2015-06-05 14:24:18 UTC) #5

https://codereview.appspot.com/237480043/diff/20001/textgen.py
File textgen.py (right):

https://codereview.appspot.com/237480043/diff/20001/textgen.py#newcode33
textgen.py:33: def get_probabilities(chains, f):
On 2015/06/05 13:01:03, shad.python wrote:
> Слово get здесь немного сбивает с толку, как будто эта функция должна вернуть
> вероятность. Лучше использовать write или output.

Done.

https://codereview.appspot.com/237480043/diff/20001/textgen.py#newcode41
textgen.py:41: def generate_text(max_depth, cdfs, text_size):
On 2015/06/05 13:01:02, shad.python wrote:
> cdfs - непонятное название

Done.

https://codereview.appspot.com/237480043/diff/20001/textgen.py#newcode125
textgen.py:125: frequencies = sorted(list(frequencies), key=lambda x: x[1])
On 2015/06/05 13:01:03, shad.python wrote:
> Этот код частично дублируется. Сделайте отдельную функцию "превратить частоты
в
> вероятности". Кроме того, все остальное тоже лучше выделить в отдельную
функцию,
> чтобы при необходимости обучать модель в другом месте кода можно было бы
просто
> вызвать эту функцию. Еще было бы удобно собрать функции обучения и генерации в
> класс, чтобы скрыть от пользователя подробности реализации.

Done.

Expand All Messages | Collapse All Messages