Помочь с проектом по учёбе. Надо по дата сету на 110 000 строк сделать 2 прогнозные модели.
Задача
The main task is to analyse a small-medium dataset related to an industrial scenario. You will need to apply two techniques on the dataset for the problem in hand, whether it is prediction, classification or clustering. Pre-processing for the dataset is required, and below you will be given an indication of which pre-processing techniques to apply. You will use Jupyter notebook to conduct your analysis and write your technical report in markup. You will use Python code, with only the following packages permitted: sklearn, numpy, matplotlib and pandas.
1- You need to pre-process the dataset and its attributes.
a. Remove noisy attributes that do not contribute to the classification problem if necessary.
b. Remove synonymous attributes if necessary.
c. Appropriate feature selection or feature extraction, if necessary
d. Deal with collinearity if necessary
e. Rescale the attributes if necessary
f. Deal with missing and duplicate values if necessary
g. Dealing with class imbalance
h. other
Note that som...
Видеть полную информацию и оставлять заявки могут только авторизованные пользователи.
Добрый день. Занимаюст машинным и глубоким обучением. Специализируюсь на Data Science, NLP, Computer Vision. Занимался разработкой алгоритмов машинного обучения для регрессии, кластеризации, классификации и уменьшения размерности данных на Python, Scikit-learn, NumPy, SciPy, pandas, matplotlib, graph-viz, а также с применением TensorFlow, Keras, PyTorch в различных целях для построения и обучения нейронных сетей в различных целях по условию тз, если оно того требует. Давайте обсудим.
Помочь с проектом по учебе. Надо по дата сету на 110 000 строк сделать 2 прогнозные модели.
Реклама
Помочь с проектом по учёбе. Надо по дата сету на 110 000 строк сделать 2 прогнозные модели.
The main task is to analyse a small-medium dataset related to an industrial scenario. You will need to apply two techniques on the dataset for the problem in hand, whether it is prediction, classification or clustering. Pre-processing for the dataset is required, and below you will be given an indication of which pre-processing techniques to apply. You will use Jupyter notebook to conduct your analysis and write your technical report in markup. You will use Python code, with only the following packages permitted: sklearn, numpy, matplotlib and pandas.
1- You need to pre-process the dataset and its attributes.
a. Remove noisy attributes that do not contribute to the classification problem if necessary.
b. Remove synonymous attributes if necessary.
c. Appropriate feature selection or feature extraction, if necessary
d. Deal with collinearity if necessary
e. Rescale the attributes if necessary
f. Deal with missing and duplicate values if necessary
g. Dealing with class imbalance
h. other
Note that som...