{"metadata":{"kernelspec":{"language":"python","display_name":"Python 3","name":"python3"},"language_info":{"name":"python","version":"3.10.12","mimetype":"text/x-python","codemirror_mode":{"name":"ipython","version":3},"pygments_lexer":"ipython3","nbconvert_exporter":"python","file_extension":".py"}},"nbformat_minor":4,"nbformat":4,"cells":[{"cell_type":"code","source":"import pandas as pd\nimport numpy as np\nfrom sklearn.preprocessing import LabelEncoder\nfrom sklearn.ensemble import GradientBoostingClassifier\nfrom sklearn.feature_extraction.text import TfidfVectorizer\nfrom sklearn.feature_extraction.text import CountVectorizer\nfrom sklearn.metrics import accuracy_score\nfrom sklearn.model_selection import train_test_split","metadata":{"execution":{"iopub.status.busy":"2023-09-02T03:47:07.256127Z","iopub.execute_input":"2023-09-02T03:47:07.256542Z","iopub.status.idle":"2023-09-02T03:47:07.263750Z","shell.execute_reply.started":"2023-09-02T03:47:07.256511Z","shell.execute_reply":"2023-09-02T03:47:07.262322Z"},"trusted":true},"execution_count":18,"outputs":[]},{"cell_type":"code","source":"df = pd.read_csv('/kaggle/input/textclassificationanton/dataset_compress_20230829.csv', delimiter=\";\")\ndf","metadata":{"execution":{"iopub.status.busy":"2023-09-02T03:47:07.295581Z","iopub.execute_input":"2023-09-02T03:47:07.296079Z","iopub.status.idle":"2023-09-02T03:47:07.357395Z","shell.execute_reply.started":"2023-09-02T03:47:07.296037Z","shell.execute_reply":"2023-09-02T03:47:07.356132Z"},"trusted":true},"execution_count":19,"outputs":[{"execution_count":19,"output_type":"execute_result","data":{"text/plain":" X_train Y_train\n0 \"5. Позвонить в отдел по продажам. Позвоните с... \"описание этапов\"\n1 \"5. Позвонить в отдел по продажам. Позвоните с... \"обход секретаря\"\n2 \"2. Представьтесь и расскажите о компании. Пре... \"правила диалога\"\n3 \"2. Представьтесь и расскажите о компании. Пре... \"разговор с ЛПР\"\n4 \"3. Объясните причину звонка. Самый простой сп... \"правила диалога\"\n... ... ...\n7218 \"Продавец: «Давайте сделаем это. Вот список не... \"возражения\"\n7219 \"Продавец: «Давайте сделаем это. Вот список не... \"принятие решения\"\n7220 \"Продавец должен использовать эту версию метод... \"правила диалога\"\n7221 \"Продавец должен использовать эту версию метод... \"возражения\"\n7222 \"Продавец должен использовать эту версию метод... \"принятие решения\"\n\n[7223 rows x 2 columns]","text/html":"
\n | X_train | \nY_train | \n
---|---|---|
0 | \n\"5. Позвонить в отдел по продажам. Позвоните с... | \n\"описание этапов\" | \n
1 | \n\"5. Позвонить в отдел по продажам. Позвоните с... | \n\"обход секретаря\" | \n
2 | \n\"2. Представьтесь и расскажите о компании. Пре... | \n\"правила диалога\" | \n
3 | \n\"2. Представьтесь и расскажите о компании. Пре... | \n\"разговор с ЛПР\" | \n
4 | \n\"3. Объясните причину звонка. Самый простой сп... | \n\"правила диалога\" | \n
... | \n... | \n... | \n
7218 | \n\"Продавец: «Давайте сделаем это. Вот список не... | \n\"возражения\" | \n
7219 | \n\"Продавец: «Давайте сделаем это. Вот список не... | \n\"принятие решения\" | \n
7220 | \n\"Продавец должен использовать эту версию метод... | \n\"правила диалога\" | \n
7221 | \n\"Продавец должен использовать эту версию метод... | \n\"возражения\" | \n
7222 | \n\"Продавец должен использовать эту версию метод... | \n\"принятие решения\" | \n
7223 rows × 2 columns
\n\n | X_train | \nY_train | \nY_encoded | \n
---|---|---|---|
0 | \n\"5. Позвонить в отдел по продажам. Позвоните с... | \n\"описание этапов\" | \n11 | \n
1 | \n\"5. Позвонить в отдел по продажам. Позвоните с... | \n\"обход секретаря\" | \n10 | \n
2 | \n\"2. Представьтесь и расскажите о компании. Пре... | \n\"правила диалога\" | \n14 | \n
3 | \n\"2. Представьтесь и расскажите о компании. Пре... | \n\"разговор с ЛПР\" | \n18 | \n
4 | \n\"3. Объясните причину звонка. Самый простой сп... | \n\"правила диалога\" | \n14 | \n
... | \n... | \n... | \n... | \n
7218 | \n\"Продавец: «Давайте сделаем это. Вот список не... | \n\"возражения\" | \n4 | \n
7219 | \n\"Продавец: «Давайте сделаем это. Вот список не... | \n\"принятие решения\" | \n17 | \n
7220 | \n\"Продавец должен использовать эту версию метод... | \n\"правила диалога\" | \n14 | \n
7221 | \n\"Продавец должен использовать эту версию метод... | \n\"возражения\" | \n4 | \n
7222 | \n\"Продавец должен использовать эту версию метод... | \n\"принятие решения\" | \n17 | \n
7223 rows × 3 columns
\n