Решена задача классификации сообщений со спамом. В ходе работы я сравнил способы векторизации: CountVectorizer, TFIDFVrctorizer. Обучил модели: sklearn.tree.DecisionTreeClassifier, sklearn.linear_model.LogisticRegression, NaiveBayes с подбором гиперпараметров и сравнил скор на кросс - валидации.
MaximIgitov/NLP_SPAM
Folders and files
| Name | Name | Last commit date | ||
|---|---|---|---|---|