Time consuming report after composition #1257

aPovidlo · 2024-02-08T15:19:41Z

Добавление таймера для подсчета времени выполнения основных процессов во время композирования пайплайна:

'Data Definition (fit)'. Определение данных во время вызова метода fit() из API.
'Applying Recommendation (fit)'. Применение стратегии по обработке данных во время вызова метода fit() из API.
'Data Preprocessing'. Время затраченное на обработку данных.
'Fitting'. Время затраченное на обучение каждого пайплайна во время композирования.
'Tuning (composing)'. Время затраченное на тюнинг гиперпараметров во время композирование.
'Tuning (post)'. Время затраченное на тюнинг гиперпараметров сверху при вызове метода tune() из API.
'Data Definition (predict)'. Определение данных во время вызова метода predict() из API.
'Applying Recommendation (predict)'. Применение стратегии по обработке данных во время вызова метода predict() из API.
'Predicting'. Время затраченное на предсказание.

После завершения обучения в композировании, можно вызвать метод return_report() из API, который вернет DataFrame с временем работы конкретной стадии.

pep8speaks · 2024-02-08T15:19:52Z

Hello @aPovidlo! Thanks for updating this PR. We checked the lines you've touched for PEP 8 issues, and found:

There are currently no PEP 8 issues detected in this Pull Request. Cheers! 🍻

Comment last updated at 2024-02-26 14:44:57 UTC

github-actions · 2024-02-08T15:20:34Z

All PEP8 errors has been fixed, thanks ❤️

Comment last updated at

nicl-nno · 2024-02-08T15:21:54Z

fedot/utilities/industrial_timer.py

+from contextlib import contextmanager
+
+
+class FedotIndustrialTimer:


Видимо надо как-то переименовать

codecov · 2024-02-08T15:30:22Z

Codecov Report

Attention: Patch coverage is 69.84127% with 19 lines in your changes are missing coverage. Please review.

Project coverage is 79.80%. Comparing base (c53881a) to head (d7944b7).

Files	Patch %	Lines
fedot/api/main.py	59.57%	19 Missing ⚠️

Additional details and impacted files

@@            Coverage Diff             @@
##           master    #1257      +/-   ##
==========================================
- Coverage   79.82%   79.80%   -0.03%     
==========================================
  Files         150      150              
  Lines       10322    10344      +22     
==========================================
+ Hits         8240     8255      +15     
- Misses       2082     2089       +7

☔ View full report in Codecov by Sentry.
📢 Have feedback on the report? Share it here.

aPovidlo · 2024-02-08T15:53:43Z

/fix-pep8

andreygetmanov

Перед композированием Федот обучается inital pipeline и выдаёт в консоль время его обучения. То же самое происходит, если не включать композирование (передать в API predefined_model=auto, например)
Это время где-то учитывается? Возможно, на стадии 'Data Preprocessing'?
Думаю, может быть полезно вынести это в отдельную строчку отчёта

aPovidlo · 2024-02-19T11:06:35Z

Перед композированием Федот обучается inital pipeline и выдаёт в консоль время его обучения. То же самое происходит, если не включать композирование (передать в API predefined_model=auto, например)

Соглашусь, что стоит учитывать это.

Это время где-то учитывается? Возможно, на стадии 'Data Preprocessing'?

Не знаю, нужно посмотреть, но навряд ли в обработке.

Думаю, может быть полезно вынести это в отдельную строчку отчёта

Не уверен. Может быть есть смысл все заносить в общее время fit.

andreygetmanov · 2024-02-20T07:30:04Z

Не уверен. Может быть есть смысл все заносить в общее время fit.

Да, можно и так
Тогда протестишь, совпадают ли время обучения initial pipeline при заданном predefined model (выводится в консоль) со временем fit в твоём отчёте?
Если да, то апруваю

fedot/utilities/composer_timer.py

andreygetmanov

Мне кажется, для практического применения в целом не так важно знать, сколько времени занимал препроцессинг на каждой стадии обучения (композинг, тюнинг, всё такое). Поэтому выводить суммарное время препроцессинга - это хорошо и удобно, согласен
Я посмотрел на процесс .fit(), и мне кажется, что можно легко рассчитать время композинга, обернув в таймер строчки, где производится композинг. Тогда fitting = composing + tuning (fit) + остатки
Самая весомая часть остатков - это метод train_on_full_dataset. Он может занимать значимое количество времени, потому что обучает модель на всём датасете + может быть информативен и полезен, потому что в связке с Predicting даст понятное представление, сколько времени уже найденная модель фитится, а сколько предиктится. Поэтому можно тоже выводить эту величину в отчёт
И методу report не хватает хорошего докстринга, где будет объяснено, что значит и как считается каждая величина. Например, крайне важным будет указать, что Data Preprocessing - это суммарное время препроцессинга за всё время запуска, а Fitting - это сумма композинга, тюнинга и обучения полученной модели на всём датасете

fedot/api/main.py

fedot/utilities/composer_timer.py

fedot/api/api_utils/api_composer.py

fedot/utilities/composer_timer.py

andreygetmanov · 2024-02-26T10:15:28Z

fedot/api/main.py

-                self.log.message('Final pipeline was fitted')
-            else:
-                self.log.message('Already fitted initial pipeline is used')
+                with fedot_composer_timer.launch_train_inference():


Только комментарий "# Final fit for obtained pipeline on full dataset" лучше не убирать, наверное

Nunkyl · 2024-02-26T14:14:15Z

fedot/api/main.py

@@ -497,6 +512,28 @@ def explain(self, features: FeaturesType = None,

        return explainer

+    def return_report(self) -> pd.DataFrame:
+        """ Functions returns report of time-consuming.


Можно немного подправить текст:

Function returns a report on time consumption.

The following steps are presented in this report:
- 'Data Definition (fit)': Time spent on data definition in fit().
- 'Data Preprocessing': Total time spent on preprocessing data, includes fitting and predicting stages.
- 'Fitting (summary)': Total time spent on Composing, Tuning and Training Inference.
- 'Composing': Time spent on searching for the best pipeline.
- 'Train Inference': Time spent on training the pipeline found during composing.
- 'Tuning (composing)': Time spent on hyperparameters tuning in the whole fitting, if with_tune is True.
- 'Tuning (after)': Time spent on .tune() (hyperparameters tuning) after composing.
- 'Data Definition (predict)': Time spent on data definition in predict().
- 'Predicting': Time spent on predicting (inference).

Nunkyl · 2024-02-26T14:16:26Z

fedot/utilities/composer_timer.py

+
+    @property
+    def report(self) -> dict:
+        """ Return dict with the next columns:


Тут то же самое

'Data Definition (fit)': Time spent on data definition in fit().

'Data Preprocessing': Total time spent on preprocessing data, includes fitting and predicting stages.

'Fitting (summary)': Total time spent on Composing, Tuning and Training Inference.

'Composing': Time spent on searching for the best pipeline.

'Train Inference': Time spent on training the pipeline found during composing.

'Tuning (composing)': Time spent on hyperparameters tuning in whole fitting, if with_tune is True.

'Tuning (after)': Time spent on .tune() (hyperparameters tuning) after composing.

'Data Definition (predict)': Time spent on data definition in predict().

'Predicting': Time spent on predicting (inference).

aPovidlo requested a review from nicl-nno February 8, 2024 15:19

nicl-nno reviewed Feb 8, 2024

View reviewed changes

nicl-nno requested a review from andreygetmanov February 8, 2024 15:25

nicl-nno requested a review from Nunkyl February 9, 2024 09:08

andreygetmanov requested changes Feb 19, 2024

View reviewed changes

andreygetmanov approved these changes Feb 20, 2024

View reviewed changes

andreygetmanov requested changes Feb 20, 2024

View reviewed changes

fedot/utilities/composer_timer.py Outdated Show resolved Hide resolved

andreygetmanov requested changes Feb 21, 2024

View reviewed changes

aPovidlo requested a review from andreygetmanov February 22, 2024 15:02

andreygetmanov approved these changes Feb 26, 2024

View reviewed changes

Nunkyl approved these changes Feb 26, 2024

View reviewed changes

aPovidlo added 12 commits February 26, 2024 17:44

Adding FI report feature

1c658b2

Fix report

fbe72a5

Fix report (1)

06f4e76

Adding time counter to tuning in composer

96d298e

Adding reset timer

ce845e1

Split tuning into several stage

95f2514

Fix preprocessing_spend_time

b9cf230

Fix cb params

a7cbca8

Renaming and PEP8 fixes

35411de

@andreygetmanov requested fixes (1)

65a2441

@andreygetmanov requested fixes (2)

e467ee9

@Nunkyl requested fixes

d7944b7

aPovidlo force-pushed the fi_exp_prep branch from 521091c to d7944b7 Compare February 26, 2024 14:44

aPovidlo merged commit c17381c into master Feb 26, 2024
7 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Time consuming report after composition #1257

Time consuming report after composition #1257

aPovidlo commented Feb 8, 2024

pep8speaks commented Feb 8, 2024 •

edited

Loading

github-actions bot commented Feb 8, 2024 •

edited

Loading

nicl-nno Feb 8, 2024

codecov bot commented Feb 8, 2024 •

edited

Loading

aPovidlo commented Feb 8, 2024

andreygetmanov left a comment

aPovidlo commented Feb 19, 2024

andreygetmanov commented Feb 20, 2024

andreygetmanov left a comment

andreygetmanov Feb 26, 2024

Nunkyl Feb 26, 2024

Nunkyl Feb 26, 2024

		from contextlib import contextmanager


		class FedotIndustrialTimer:

Time consuming report after composition #1257

Time consuming report after composition #1257

Conversation

aPovidlo commented Feb 8, 2024

pep8speaks commented Feb 8, 2024 • edited Loading

Comment last updated at 2024-02-26 14:44:57 UTC

github-actions bot commented Feb 8, 2024 • edited Loading

Comment last updated at

nicl-nno Feb 8, 2024

Choose a reason for hiding this comment

codecov bot commented Feb 8, 2024 • edited Loading

Codecov Report

aPovidlo commented Feb 8, 2024

andreygetmanov left a comment

Choose a reason for hiding this comment

aPovidlo commented Feb 19, 2024

andreygetmanov commented Feb 20, 2024

andreygetmanov left a comment

Choose a reason for hiding this comment

andreygetmanov Feb 26, 2024

Choose a reason for hiding this comment

Nunkyl Feb 26, 2024

Choose a reason for hiding this comment

Nunkyl Feb 26, 2024

Choose a reason for hiding this comment

pep8speaks commented Feb 8, 2024 •

edited

Loading

github-actions bot commented Feb 8, 2024 •

edited

Loading

codecov bot commented Feb 8, 2024 •

edited

Loading