Цель этой книги - разработать модель, которая классифицирует, является ли определенный веб-сайт легитимным или вредоносным, используя методологию машинного обучения, и определить, приведет ли увеличение набора признаков модели к увеличению ее производительности. Авторы использовали три разных случая для создания оптимальной модели, каждый из которых отличается количеством признаков, используемых в наборе данных. В первом случае использовался базовый или оригинальный набор данных. Во втором случае использовался расширенный набор признаков. В расширенном наборе признаков использовался алгоритм выбора признаков для создания нового набора данных для третьего случая. Для создания моделей использовались классификаторы Random Forest, J48, C-SVC и kNN. Результат показал увеличение производительности при сравнении моделей первого случая со вторым. При сравнении моделей второго случая с моделями третьего значительных изменений не наблюдалось. Исследование показало, что существует прямо пропорm