Bert_Ukr_in_Swiss
This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.
Usage
To use this model, please install BERTopic:
pip install -U bertopic
You can use the model as follows:
from bertopic import BERTopic
topic_model = BERTopic.load("Alprocco/Bert_Ukr_in_Swiss")
topic_model.get_topic_info()
Topic overview
- Number of topics: 267
- Number of training documents: 550677
<details> {-1: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 0: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Information Requests'}, 1: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 2: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Medical Insurance'}, 3: {'cluster_id': 2, 'cluster_name': 'Pet', 'sub_cluster': 'Pet'}, 4: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Asylum'}, 5: {'cluster_id': 3, 'cluster_name': 'Transportation', 'sub_cluster': 'Ticket Inquiries'}, 6: {'cluster_id': 3, 'cluster_name': 'Transportation', 'sub_cluster': 'Carriers, Transport to and from Ukraine'}, 7: {'cluster_id': 4, 'cluster_name': 'Accommodation', 'sub_cluster': 'Seeking'}, 8: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 9: {'cluster_id': 5, 'cluster_name': 'Volunteering', 'sub_cluster': 'Volunteering'}, 10: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Communication'}, 11: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Translation Services'}, 12: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Passport'}, 13: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Dentistry'}, 14: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Job'}, 15: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Currency'}, 16: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Banking'}, 17: {'cluster_id': 8, 'cluster_name': 'Social Services', 'sub_cluster': 'Protocols'}, 18: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Mail'}, 19: {'cluster_id': 9, 'cluster_name': 'Education', 'sub_cluster': 'Education'}, 20: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Clothing'}, 21: {'cluster_id': 8, 'cluster_name': 'Social Services', 'sub_cluster': 'Financial Assistance'}, 22: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 23: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 24: {'cluster_id': 3, 'cluster_name': 'Transportation', 'sub_cluster': 'Carriers, Transport to and from Ukraine'}, 25: {'cluster_id': 9, 'cluster_name': 'Education', 'sub_cluster': 'Education'}, 26: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 27: {'cluster_id': 3, 'cluster_name': 'Transportation', 'sub_cluster': 'Public Transportation'}, 28: {'cluster_id': 4, 'cluster_name': 'Accommodation', 'sub_cluster': 'Leasing Regulation'}, 29: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 30: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Open Chat'}, 31: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Communication'}, 32: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 33: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Regulation'}, 34: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Food'}, 35: {'cluster_id': 2, 'cluster_name': 'Pet', 'sub_cluster': 'Pet'}, 36: {'cluster_id': 3, 'cluster_name': 'Transportation', 'sub_cluster': 'Carriers, Transport to and from Ukraine'}, 37: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Vehicle'}, 38: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 39: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 40: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Medical Request'}, 41: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 42: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Status Acquisition'}, 43: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Consulate Services'}, 44: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 45: {'cluster_id': 3, 'cluster_name': 'Transportation', 'sub_cluster': 'Public Transportation'}, 46: {'cluster_id': 5, 'cluster_name': 'Volunteering', 'sub_cluster': 'Volunteering'}, 47: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 48: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Vehicle'}, 49: {'cluster_id': 4, 'cluster_name': 'Accommodation', 'sub_cluster': 'Seeking'}, 50: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Immigration Procedure'}, 51: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'War Chat'}, 52: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 53: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Network Provider'}, 54: {'cluster_id': 9, 'cluster_name': 'Education', 'sub_cluster': 'Education'}, 55: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 56: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 57: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Asylum'}, 58: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 59: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Leisure and Fitness'}, 60: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Tax'}, 61: {'cluster_id': 4, 'cluster_name': 'Accommodation', 'sub_cluster': 'Expense'}, 62: {'cluster_id': 4, 'cluster_name': 'Accommodation', 'sub_cluster': 'Seeking'}, 63: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 64: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 65: {'cluster_id': 3, 'cluster_name': 'Transportation', 'sub_cluster': 'Carriers, Transport to and from Ukraine'}, 66: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 67: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 68: {'cluster_id': 3, 'cluster_name': 'Transportation', 'sub_cluster': 'Public Transportation'}, 69: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Family Reunion'}, 70: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 71: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Medical Request'}, 72: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 73: {'cluster_id': 3, 'cluster_name': 'Transportation', 'sub_cluster': 'Public Transportation'}, 74: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 75: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Vaccinations'}, 76: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Police'}, 77: {'cluster_id': 8, 'cluster_name': 'Social Services', 'sub_cluster': 'Financial Assistance'}, 78: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Regulation'}, 79: {'cluster_id': 3, 'cluster_name': 'Transportation', 'sub_cluster': 'Carriers, Transport to and from Ukraine'}, 80: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 81: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Medical Request'}, 82: {'cluster_id': 3, 'cluster_name': 'Transportation', 'sub_cluster': 'Public Transportation'}, 83: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Parking'}, 84: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 85: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Travel'}, 86: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 87: {'cluster_id': 11, 'cluster_name': 'Legal information', 'sub_cluster': 'Legal information'}, 88: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 89: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 90: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Medical Insurance'}, 91: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Network Provider'}, 92: {'cluster_id': 9, 'cluster_name': 'Education', 'sub_cluster': 'Education'}, 93: {'cluster_id': 4, 'cluster_name': 'Accommodation', 'sub_cluster': 'Seeking'}, 94: {'cluster_id': 12, 'cluster_name': 'Religious Information', 'sub_cluster': 'Religious Information'}, 95: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Network Provider'}, 96: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 97: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 98: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 99: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 100: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Banking'}, 101: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 102: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 103: {'cluster_id': 8, 'cluster_name': 'Social Services', 'sub_cluster': 'Library'}, 104: {'cluster_id': 8, 'cluster_name': 'Social Services', 'sub_cluster': 'Library'}, 105: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Tax'}, 106: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Police'}, 107: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Travel'}, 108: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 109: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Network Provider'}, 110: {'cluster_id': 11, 'cluster_name': 'Legal information', 'sub_cluster': 'Legal information'}, 111: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Passport'}, 112: {'cluster_id': 9, 'cluster_name': 'Education', 'sub_cluster': 'Education'}, 113: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Regulation'}, 114: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Immigration Procedure'}, 115: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 116: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 117: {'cluster_id': 9, 'cluster_name': 'Education', 'sub_cluster': 'Education'}, 118: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Job'}, 119: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 120: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 121: {'cluster_id': 4, 'cluster_name': 'Accommodation', 'sub_cluster': 'Seeking'}, 122: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Translation Services'}, 123: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Medical Insurance'}, 124: {'cluster_id': 4, 'cluster_name': 'Accommodation', 'sub_cluster': 'Seeking'}, 125: {'cluster_id': 11, 'cluster_name': 'Legal information', 'sub_cluster': 'Legal information'}, 126: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 127: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 128: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 129: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Psychotherapy'}, 130: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 131: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 132: {'cluster_id': 4, 'cluster_name': 'Accommodation', 'sub_cluster': 'Seeking'}, 133: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Immigration Procedure'}, 134: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 135: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Home Appliances'}, 136: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 137: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 138: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 139: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Tax'}, 140: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Vaccinations'}, 141: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Travel'}, 142: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Medical Request'}, 143: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Shopping'}, 144: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 145: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 146: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 147: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Job'}, 148: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Vehicle'}, 149: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 150: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 151: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 152: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Medical Request'}, 153: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 154: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 155: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 156: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 157: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 158: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Leisure and Fitness'}, 159: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 160: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Communication'}, 161: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Leisure and Fitness'}, 162: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 163: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 164: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Travel'}, 165: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Shopping'}, 166: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 167: {'cluster_id': 3, 'cluster_name': 'Transportation', 'sub_cluster': 'Public Transportation'}, 168: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Communication'}, 169: {'cluster_id': 12, 'cluster_name': 'Religious Information', 'sub_cluster': 'Religious Information'}, 170: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Shopping'}, 171: {'cluster_id': 3, 'cluster_name': 'Transportation', 'sub_cluster': 'Taxi Services'}, 172: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Travel'}, 173: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Travel'}, 174: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 175: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Open Chat'}, 176: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 177: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 178: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Travel'}, 179: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Immigration Procedure'}, 180: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 181: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 182: {'cluster_id': 11, 'cluster_name': 'Legal information', 'sub_cluster': 'Divorce'}, 183: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 184: {'cluster_id': 8, 'cluster_name': 'Social Services', 'sub_cluster': 'Protocols'}, 185: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Shopping'}, 186: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 187: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Immigration Procedure'}, 188: {'cluster_id': 11, 'cluster_name': 'Legal information', 'sub_cluster': 'Marriage'}, 189: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Job'}, 190: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 191: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 192: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Leisure and Fitness'}, 193: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Travel'}, 194: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 195: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 196: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 197: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Leisure and Fitness'}, 198: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Shopping'}, 199: {'cluster_id': 5, 'cluster_name': 'Volunteering', 'sub_cluster': 'Volunteering'}, 200: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Job'}, 201: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Logistics'}, 202: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 203: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Consulate Services'}, 204: {'cluster_id': 4, 'cluster_name': 'Accommodation', 'sub_cluster': 'Seeking'}, 205: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Other Item Request'}, 206: {'cluster_id': 4, 'cluster_name': 'Accommodation', 'sub_cluster': 'Leasing Regulation'}, 207: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Other Item Request'}, 208: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Job'}, 209: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 210: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 211: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 212: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 213: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Infant & Toddler Care'}, 214: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 215: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 216: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 217: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Regulation'}, 218: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 219: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Medical Request'}, 220: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 221: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 222: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Hospice Care'}, 223: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 224: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 225: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Medical Request'}, 226: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 227: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Dentistry'}, 228: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 229: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 230: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Customs'}, 231: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 232: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 233: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Customs'}, 234: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Customs'}, 235: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Disability'}, 236: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 237: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 238: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 239: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 240: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Regulation'}, 241: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Network Provider'}, 242: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 243: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 244: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 245: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Leisure and Fitness'}, 246: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 247: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Travel'}, 248: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 249: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Leisure and Fitness'}, 250: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Immigration Procedure'}, 251: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Regulation'}, 252: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 253: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Open Chat'}, 254: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 255: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Medical Request'}, 256: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Immigration Procedure'}, 257: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 258: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 259: {'cluster_id': 8, 'cluster_name': 'Social Services', 'sub_cluster': 'Protocols'}, 260: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 261: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 262: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 263: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Infant & Toddler Care'}, 264: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Shopping'}, 265: {'cluster_id': 5, 'cluster_name': 'Volunteering', 'sub_cluster': 'Volunteering'}} <summary>Click here for an overview of all topics.</summary>
Topic ID | Topic Keywords | Topic Frequency | Label |
---|---|---|---|
-1 | швейцарии - швейцарії - статус - 00 - добрый | 102 | -1_швейцарии_швейцарії_статус_00 |
0 | беженцев - украину - украины - біженців - україни | 271717 | 0_беженцев_украину_украины_біженців |
1 | паляниця - огромное - благодарю - ответ - паляниця доброго | 46975 | 1_паляниця_огромное_благодарю_ответ |
2 | страховка - страховку - врачу - страховки - врача | 17173 | 2_страховка_страховку_врачу_страховки |
3 | животных - собаку - собак - собаки - собака | 16379 | 3_животных_собаку_собак_собаки |
4 | лагере - лагерь - лагеря - лагерях - таборі | 6680 | 4_лагере_лагерь_лагеря_лагерях |
5 | билет - билеты - квиток - билета - проездной | 5178 | 5_билет_билеты_квиток_билета |
6 | кантоне - кантона - кантону - каком кантоне - кантоны | 5160 | 6_кантоне_кантона_кантону_каком кантоне |
7 | квартиру - ищу - ищем - жильё - жилье | 5091 | 7_квартиру_ищу_ищем_жильё |
8 | завтра - 00 - августа - 30 - сентября | 4428 | 8_завтра_00_августа_30 |
9 | вокзале - волонтеры - волонтеров - волонтёры - волонтёров | 4414 | 9_вокзале_волонтеры_волонтеров_волонтёры |
10 | языка - язык - англійської - мови - англійської мови | 4203 | 10_языка_язык_англійської_мови |
11 | переводчик - переводчика - перевод - нужен переводчик - переводчиком | 3971 | 11_переводчик_переводчика_перевод_нужен переводчик |
12 | паспорт - паспорта - паспорту - загран - паспортом | 3912 | 12_паспорт_паспорта_паспорту_загран |
13 | зуб - зубы - стоматолог - лечение - страховка | 3855 | 13_зуб_зубы_стоматолог_лечение |
14 | работу - роботу - контракт - работодатель - резюме | 3769 | 14_работу_роботу_контракт_работодатель |
15 | евро - франки - франков - гривны - поменять | 3752 | 15_евро_франки_франков_гривны |
16 | банк - банке - банка - банку - счёт | 3195 | 16_банк_банке_банка_банку |
17 | соц - соц помощь - социальной - служба - работника | 3121 | 17_соц_соц помощь_социальной_служба |
18 | письмо - почту - почте - пришло - письма | 2557 | 18_письмо_почту_почте_пришло |
19 | навчання - мови - школу - школа - школи | 2552 | 19_навчання_мови_школу_школа |
20 | обувь - размер - одежда - взуття - одежду | 2421 | 20_обувь_размер_одежда_взуття |
21 | детей - ребёнка - ребенка - пособие - выплаты | 2264 | 21_детей_ребёнка_ребенка_пособие |
22 | köln - 41 - basel - 380 - duisburg | 2025 | 22_köln_41_basel_380 |
23 | город - городе - каком городе - города - каком | 1948 | 23_город_городе_каком городе_города |
24 | перевозчика - перевозчиков - перевізника - перевізників - перевозчик | 1927 | 24_перевозчика_перевозчиков_перевізника_перевізників |
25 | школу - школы - школа - школе - школи | 1900 | 25_школу_школы_школа_школе |
26 | группу - группа - добавьте - добавьте группу - группе | 1896 | 26_группу_группа_добавьте_добавьте группу |
27 | поезд - поезда - поезде - потяг - поездом | 1843 | 27_поезд_поезда_поезде_потяг |
28 | договор - аренды - квартиры - квартиру - аренду | 1839 | 28_договор_аренды_квартиры_квартиру |
29 | знаю - знаю знаю - сожалению - сожалению знаю - честно | 1774 | 29_знаю_знаю знаю_сожалению_сожалению знаю |
30 | стране - страну - страны - страна - другую страну | 1769 | 30_стране_страну_страны_страна |
31 | французского - французької - французский - языка - мови | 1766 | 31_французского_французької_французский_языка |
32 | ссылку - сайт - сайте - посилання - ссылка | 1750 | 32_ссылку_сайт_сайте_посилання |
33 | базель - базеле - бассейн - базеля - базелі | 1697 | 33_базель_базеле_бассейн_базеля |
34 | кг - молоко - продукты - кофе - мясо | 1660 | 34_кг_молоко_продукты_кофе |
35 | волос - парикмахер - стрижка - стрижки - ботокс | 1642 | 35_волос_парикмахер_стрижка_стрижки |
36 | україна - слава україні - слава - україні - україни | 1631 | 36_україна_слава україні_слава_україні |
37 | авто - машину - машины - машина - автомобиль | 1627 | 37_авто_машину_машины_машина |
38 | чат - сообщения - чату - сообщениях - чаті | 1623 | 38_чат_сообщения_чату_сообщениях |
39 | месяца - недели - месяц - дней - месяцев | 1606 | 39_месяца_недели_месяц_дней |
40 | магазин - магазины - магазине - магазина - магазинах | 1518 | 40_магазин_магазины_магазине_магазина |
41 | деньги - выплаты - платить - гроші - денег | 1517 | 41_деньги_выплаты_платить_гроші |
42 | статус - статуса - статус статус - статусом - получения статуса | 1481 | 42_статус_статуса_статус статус_статусом |
43 | посольство - консульство - посольстве - посольства - консульства | 1385 | 43_посольство_консульство_посольстве_посольства |
44 | имеете - шо - имеете ввиду - маєте увазі - виду | 1369 | 44_имеете_шо_имеете ввиду_маєте увазі |
45 | самолёт - аэропорта - аэропорту - аэропорт - літак | 1365 | 45_самолёт_аэропорта_аэропорту_аэропорт |
46 | бесплатно - безкоштовно - бесплатный - бесплатные - gratis | 1327 | 46_бесплатно_безкоштовно_бесплатный_бесплатные |
47 | адрес - адресу - адреса - подскажите адрес - точный адрес | 1319 | 47_адрес_адресу_адреса_подскажите адрес |
48 | велосипед - велосипеды - велосипеда - велосипедов - самокат | 1292 | 48_велосипед_велосипеды_велосипеда_велосипедов |
49 | диван - мебель - мебели - меблі - перевезти | 1251 | 49_диван_мебель_мебели_меблі |
50 | миграционную - миграционной - миграционную службу - службу - миграционный | 1246 | 50_миграционную_миграционной_миграционную службу_службу |
51 | война - войны - війна - війни - закончится | 1242 | 51_война_войны_війна_війни |
52 | фр - 300 - 200 - 100 - 500 | 1224 | 52_фр_300_200_100 |
53 | телефон - айфон - телефона - телефонов - продам | 1211 | 53_телефон_айфон_телефона_телефонов |
54 | математики - курсы - курси - заняття - курсов | 1207 | 54_математики_курсы_курси_заняття |
55 | заберу - возьму - брала - собираюсь - иду | 1185 | 55_заберу_возьму_брала_собираюсь |
56 | номер - контакт - контакты - контакти - позвонить | 1110 | 56_номер_контакт_контакты_контакти |
57 | гуманитарной - гуманитарную - гуманитарную помощь - гуманитарной помощи - гуманитарная | 1090 | 57_гуманитарной_гуманитарную_гуманитарную помощь_гуманитарной помощи |
58 | информация - источник - документы - документ - інформація | 1039 | 58_информация_источник_документы_документ |
59 | футбол - спорт - тренер - спорта - зал | 1008 | 59_футбол_спорт_тренер_спорта |
60 | налог - налоги - налогов - налоговой - tax | 963 | 60_налог_налоги_налогов_налоговой |
61 | отопление - электричество - вода - газ - воду | 952 | 61_отопление_электричество_вода_газ |
62 | кровать - ліжко - матрас - матрац - кровати | 951 | 62_кровать_ліжко_матрас_матрац |
63 | личку - напишу - напишите - написала - написать | 944 | 63_личку_напишу_напишите_написала |
64 | итальянского - италии - италию - итальянский - итальянском | 939 | 64_итальянского_италии_италию_итальянский |
65 | чемодан - сумка - чемоданы - сумку - сумки | 922 | 65_чемодан_сумка_чемоданы_сумку |
66 | карту - карта - карте - сим карту - сим | 918 | 66_карту_карта_карте_сим карту |
67 | находитесь - живете - живёте - знаходитесь - проживаете | 912 | 67_находитесь_живете_живёте_знаходитесь |
68 | junior - билет - проездной - ездить - взрослого | 894 | 68_junior_билет_проездной_ездить |
69 | семьи - воссоединение - семью - семья - воссоединение семьи | 871 | 69_семьи_воссоединение_семью_семья |
70 | швейцарии - языка - школу - язык - английский | 870 | 70_швейцарии_языка_школу_язык |
71 | очки - окуляри - fielmann - зрение - очков | 862 | 71_очки_окуляри_fielmann_зрение |
72 | детей - дети - детьми - детям - мама | 861 | 72_детей_дети_детьми_детям |
73 | автобус - автобусы - автобуса - автобусом - автобусе | 850 | 73_автобус_автобусы_автобуса_автобусом |
74 | user - користувача - налаштуваннях - info - чату | 846 | 74_user_користувача_налаштуваннях_info |
75 | прививки - тест - сертификат - ковид - ковида | 846 | 75_прививки_тест_сертификат_ковид |
76 | полицию - полиции - полиция - поліцію - поліція | 835 | 76_полицию_полиции_полиция_поліцію |
77 | крест - красный крест - красный - креста - красного креста | 818 | 77_крест_красный крест_красный_креста |
78 | праздник - фестиваль - ярмарка - роком - свято | 802 | 78_праздник_фестиваль_ярмарка_роком |
79 | львова - львов - львів - цюриха - місця | 792 | 79_львова_львов_львів_цюриха |
80 | девушка - девушке - спрашивала - женщина - девушки | 790 | 80_девушка_девушке_спрашивала_женщина |
81 | русскоговорящего - врач - русскоговорящий - русскоговорящих - врача | 789 | 81_русскоговорящего_врач_русскоговорящий_русскоговорящих |
82 | будапешт - будапешта - поезд - мукачево - венгрии | 769 | 82_будапешт_будапешта_поезд_мукачево |
83 | парковки - парковка - парковку - парковке - машину | 755 | 83_парковки_парковка_парковку_парковке |
84 | июнь - июль - выплаты - июня - май | 752 | 84_июнь_июль_выплаты_июня |
85 | кораблики - озера - озеро - озеру - озере | 706 | 85_кораблики_озера_озеро_озеру |
86 | думку - людей - мнение - людям - человек | 704 | 86_думку_людей_мнение_людям |
87 | юриста - юрист - адвоката - адвокат - юристы | 682 | 87_юриста_юрист_адвоката_адвокат |
88 | массаж - спортивный - спина - общению - профессиональный | 655 | 88_массаж_спортивный_спина_общению |
89 | страховка - страховку - швейцарии - страховки - страховой | 646 | 89_страховка_страховку_швейцарии_страховки |
90 | пластик - пластика - пластику - пластиком - новый | 634 | 90_пластик_пластика_пластику_пластиком |
91 | ноутбук - ноутбуки - ноутбука - ремонт - пк | 623 | 91_ноутбук_ноутбуки_ноутбука_ремонт |
92 | уроки - музыки - играть - музыкой - преподаватель | 621 | 92_уроки_музыки_играть_музыкой |
93 | сайты - жилья - поиска - подскажите сайты - поиска жилья | 609 | 93_сайты_жилья_поиска_подскажите сайты |
94 | церкви - церковь - святого - неділю - служба | 606 | 94_церкви_церковь_святого_неділю |
95 | интернет - интернета - інтернет - роутер - wi | 562 | 95_интернет_интернета_інтернет_роутер |
96 | пользователь - размещать - внимательны - user - услуги | 560 | 96_пользователь_размещать_внимательны_user |
97 | бронь - брони - броні - revolut - улице | 551 | 97_бронь_брони_броні_revolut |
98 | цена - ціна - цены - стоимость - цену | 546 | 98_цена_ціна_цены_стоимость |
99 | ехали - ходили - едем - одессы - находимся | 533 | 99_ехали_ходили_едем_одессы |
100 | карточку - карточки - карты - картку - карточка | 533 | 100_карточку_карточки_карты_картку |
101 | интересует - интересует вопрос - цікавить - вопрос интересует - интересно | 528 | 101_интересует_интересует вопрос_цікавить_вопрос интересует |
102 | мусора - мусор - сміття - пакеты - картон | 527 | 102_мусора_мусор_сміття_пакеты |
103 | книги - книжки - библиотеке - книгу - библиотеки | 517 | 103_книги_книжки_библиотеке_книгу |
104 | книги - книжки - книг - украинском - українською | 515 | 104_книги_книжки_книг_украинском |
105 | налог - налоги - швейцарии - податки - доход | 495 | 105_налог_налоги_швейцарии_податки |
106 | штраф - штрафы - штрафа - штрафов - выписали | 487 | 106_штраф_штрафы_штрафа_штрафов |
107 | музей - музеи - музеї - art - музея | 480 | 107_музей_музеи_музеї_art |
108 | фото - скиньте фото - фотографии - скину - картинку | 477 | 108_фото_скиньте фото_фотографии_скину |
109 | радио - телевизор - телевидение - радіо - тв | 454 | 109_радио_телевизор_телевидение_радіо |
110 | закон - закона - законы - закону - законом | 445 | 110_закон_закона_законы_закону |
111 | 90 - 90 дней - шенгена - шенген - шенгену | 443 | 111_90_90 дней_шенгена_шенген |
112 | ukraine_reborn - montbrillant 52 - rue montbrillant - організовує_ukraine_reborn - montbrillant | 435 | 112_ukraine_reborn_montbrillant 52_rue montbrillant_організовує_ukraine_reborn |
113 | мітинг - оон - женеві - завтра - сегодня | 431 | 113_мітинг_оон_женеві_завтра |
114 | границе - границы - границу - кордон - кордону | 427 | 114_границе_границы_границу_кордон |
115 | размер - см - розмір - размеры - ширина | 422 | 115_размер_см_розмір_размеры |
116 | ждать - жду - ждём - чекати - чекаю | 417 | 116_ждать_жду_ждём_чекати |
117 | facebook - telegram instagram - сторінка facebook - facebook telegram - ukraine_reborn | 416 | 117_facebook_telegram instagram_сторінка facebook_facebook telegram |
118 | фотограф - фото - фотографії - камера - основи | 413 | 118_фотограф_фото_фотографії_камера |
119 | извините - вибачте - простите - жаль - прощения | 410 | 119_извините_вибачте_простите_жаль |
120 | фейсбуке - marketplace - фейсбук - фейсбуці - facebook | 392 | 120_фейсбуке_marketplace_фейсбук_фейсбуці |
121 | berlin - берлине - looking - room - hello | 390 | 121_berlin_берлине_looking_room |
122 | рождении - свидетельство - свидетельства - свидетельство рождении - народження | 381 | 122_рождении_свидетельство_свидетельства_свидетельство рождении |
123 | страхование - страховку - страховка - страховой - страховки | 375 | 123_страхование_страховку_страховка_страховой |
124 | собака - собачка - ищем - маленькая - жильё | 372 | 124_собака_собачка_ищем_маленькая |
125 | юриста - адвокат - адвоката - юрист - юристов | 362 | 125_юриста_адвокат_адвоката_юрист |
126 | приложение - приложении - додаток - приложения - app | 359 | 126_приложение_приложении_додаток_приложения |
127 | зоопарк - зоопарка - zoo - вход - бесплатный | 355 | 127_зоопарк_зоопарка_zoo_вход |
128 | вода - воду - воды - пить - туалет | 351 | 128_вода_воду_воды_пить |
129 | психолог - психолога - психотерапевт - працюю - психологическая | 351 | 129_психолог_психолога_психотерапевт_працюю |
130 | пять - числа - число - штук - 10 | 349 | 130_пять_числа_число_штук |
131 | европе - европу - европа - европы - європі | 348 | 131_европе_европу_европа_европы |
132 | отель - отеле - готель - хостел - отеля | 347 | 132_отель_отеле_готель_хостел |
133 | биометрию - биометрии - біометрію - spop - биометрия | 346 | 133_биометрию_биометрии_біометрію_spop |
134 | завалили - рашист - user - irina - iryna | 346 | 134_завалили_рашист_user_irina |
135 | машинку - машину - машинка - машина - мыть | 346 | 135_машинку_машину_машинка_машина |
136 | германию - берлин - продуктами - берлина - германии | 343 | 136_германию_берлин_продуктами_берлина |
137 | год - года - конца года - году - год момента | 338 | 137_год_года_конца года_году |
138 | sunrise - swisscom - користування - кінця - конца августа | 336 | 138_sunrise_swisscom_користування_кінця |
139 | украине - налог - податки - налоги - доход | 328 | 139_украине_налог_податки_налоги |
140 | прививки - тест - ковид - ковида - сертификат | 328 | 140_прививки_тест_ковид_ковида |
141 | турист - турцию - туризм - маршруты - поездки | 321 | 141_турист_турцию_туризм_маршруты |
142 | коляска - коляску - кресло - нужна - детское | 317 | 142_коляска_коляску_кресло_нужна |
143 | дешевле - дешевше - дешевле купить - цены - aldi | 307 | 143_дешевле_дешевше_дешевле купить_цены |
144 | чехии - молдову - добраться - молдовы - границе | 304 | 144_чехии_молдову_добраться_молдовы |
145 | авторизации - послал - действие - 2023 - ссылку | 303 | 145_авторизации_послал_действие_2023 |
146 | заказ - замовлення - народження - кондитер - делает | 298 | 146_заказ_замовлення_народження_кондитер |
147 | мастера - маникюра - мастера маникюра - ищу мастера - педикюра | 293 | 147_мастера_маникюра_мастера маникюра_ищу мастера |
148 | бензин - газ - продам - заправки - автомат | 293 | 148_бензин_газ_продам_заправки |
149 | магазин - украинцев - українські - вареники - українських | 287 | 149_магазин_украинцев_українські_вареники |
150 | повезло - удачи - повезёт - пощастило - щастить | 285 | 150_повезло_удачи_повезёт_пощастило |
151 | green - зелёную - зелёная - карта - карту | 284 | 151_green_зелёную_зелёная_карта |
152 | сигареты - сигарет - курить - пачки - алкоголь | 277 | 152_сигареты_сигарет_курить_пачки |
153 | крісло - кресло - стула - стул - стулья | 273 | 153_крісло_кресло_стула_стул |
154 | танці - танцы - танців - заняття - вівторок | 272 | 154_танці_танцы_танців_заняття |
155 | мошенники - шахраї - мошенников - шахрайство - мошенник | 271 | 155_мошенники_шахраї_мошенников_шахрайство |
156 | девочки - дівчата - девчонки - девушки - маникюр | 270 | 156_девочки_дівчата_девчонки_девушки |
157 | спам - бот - админы - админ - канале | 270 | 157_спам_бот_админы_админ |
158 | концерт - театр - 00 - фестиваль - сегодня | 270 | 158_концерт_театр_00_фестиваль |
159 | канал - канале - каналу - канала - описании группы | 268 | 159_канал_канале_каналу_канала |
160 | немецкий - немецкого - школе - дети - школу | 262 | 160_немецкий_немецкого_школе_дети |
161 | йога - инструктор - йоги - занятие - занятия | 260 | 161_йога_инструктор_йоги_занятие |
162 | онлайн - регистрацию - регистрация - регистрации - регистрироваться | 255 | 162_онлайн_регистрацию_регистрация_регистрации |
163 | сарказм - смешно - шутка - юмор - смішно | 249 | 163_сарказм_смешно_шутка_юмор |
164 | париж - францию - франции - билеты - билет | 248 | 164_париж_францию_франции_билеты |
165 | цветов - квіток - цветы - сад - саду | 241 | 165_цветов_квіток_цветы_сад |
166 | реклама - рекламу - рекламы - dwarn - объявления | 240 | 166_реклама_рекламу_рекламы_dwarn |
167 | sbb - mobile - приложение - сайте sbb - приложении sbb | 236 | 167_sbb_mobile_приложение_сайте sbb |
168 | б1 - второй - b2 - пачки - две | 236 | 168_б1_второй_b2_пачки |
169 | церкви - церковь - українська - украинская - української | 234 | 169_церкви_церковь_українська_украинская |
170 | русских - магазин - магазине - русском - русский | 234 | 170_русских_магазин_магазине_русском |
171 | такси - такс - халб - фри - хальб | 233 | 171_такси_такс_халб_фри |
172 | горы - горах - гори - гору - гор | 231 | 172_горы_горах_гори_гору |
173 | 90 - 90 дней - дней - 90 днів - днів | 230 | 173_90_90 дней_дней_90 днів |
174 | стол - стіл - столик - письменный - стола | 222 | 174_стол_стіл_столик_письменный |
175 | мужчин - женщин - мужчины - мужчинам - женщины | 219 | 175_мужчин_женщин_мужчины_мужчинам |
176 | ваучер - ваучеры - хальбтакс - halbtax - халбтакс | 218 | 176_ваучер_ваучеры_хальбтакс_halbtax |
177 | пораду - рекомендую - совет - советы - рекомендации | 217 | 177_пораду_рекомендую_совет_советы |
178 | зоопарк - zoo - украинцев - вход - українців | 214 | 178_зоопарк_zoo_украинцев_вход |
179 | тест - пцр - ковид - тесты - тест корону | 213 | 179_тест_пцр_ковид_тесты |
180 | австрии - австрию - австрії - австрия - райффайзен | 212 | 180_австрии_австрию_австрії_австрия |
181 | видео - відео - youtube - ютубе - ютубі | 211 | 181_видео_відео_youtube_ютубе |
182 | развод - розвод - подружжя - деньги - ведитесь | 210 | 182_развод_розвод_подружжя_деньги |
183 | безкоштовне - безкоштовне заняття - заняття - 3d - ігри | 209 | 183_безкоштовне_безкоштовне заняття_заняття_3d |
184 | пенсию - пенсии - пенсионного - инвалидности - фонд | 206 | 184_пенсию_пенсии_пенсионного_инвалидности |
185 | распечатать - роздрукувати - документы - документи - документ | 203 | 185_распечатать_роздрукувати_документы_документи |
186 | канаду - визу - канада - визы - канаде | 201 | 186_канаду_визу_канада_визы |
187 | виза - визу - визы - віза - візу | 199 | 187_виза_визу_визы_віза |
188 | брак - замуж - браке - выйти - офіційно | 199 | 188_брак_замуж_браке_выйти |
189 | парикмахер - стрижки - волосся - стрижка - салоне | 196 | 189_парикмахер_стрижки_волосся_стрижка |
190 | 16 - 18 - 14 16 - 17 - 14 | 196 | 190_16_18_14 16_17 |
191 | занимаетесь - спрашиваете - чья - режи - делаете | 196 | 191_занимаетесь_спрашиваете_чья_режи |
192 | прокат - зимой - зиму - кататься - покататься | 194 | 192_прокат_зимой_зиму_кататься |
193 | бесплатный - проезд - бесплатный проезд - бесплатного проезда - бесплатного | 192 | 193_бесплатный_проезд_бесплатный проезд_бесплатного проезда |
194 | 2024 - 2023 - 2022 - 2024 года - 2021 | 191 | 194_2024_2023_2022_2024 года |
195 | лампы - светлана - свет - света - світло | 187 | 195_лампы_светлана_свет_света |
196 | предупреждение - авторизации - послал - действие - 11 2022 | 185 | 196_предупреждение_авторизации_послал_действие |
197 | спробувати - малювати - малювання - картини - художник | 175 | 197_спробувати_малювати_малювання_картини |
198 | магазинах - магазине - гречка - магазин - магазины | 175 | 198_магазинах_магазине_гречка_магазин |
199 | волонтеров - волонтеры - волонтёров - волонтерів - швейцарии | 175 | 199_волонтеров_волонтеры_волонтёров_волонтерів |
200 | косметолога - косметолог - чистку - лица - образованием | 175 | 200_косметолога_косметолог_чистку_лица |
201 | кг - вес - фр - 10 фр - ваги | 174 | 201_кг_вес_фр_10 фр |
202 | user - marina - elena - ирина - ekaterina | 171 | 202_user_marina_elena_ирина |
203 | дюссельдорфе - консульство - дюссельдорф - консульстве - термин | 169 | 203_дюссельдорфе_консульство_дюссельдорф_консульстве |
204 | airbnb - booking - аренды - ваучер - снять | 166 | 204_airbnb_booking_аренды_ваучер |
205 | вина - мартини - виньетку - пиво - вино | 166 | 205_вина_мартини_виньетку_пиво |
206 | квартиры - квартиру - житло - украинцев - украинцам | 163 | 206_квартиры_квартиру_житло_украинцев |
207 | флаг - прапор - украинский - український - флаги | 161 | 207_флаг_прапор_украинский_український |
208 | вимоги - знання - hotel - ресторан - роботи | 161 | 208_вимоги_знання_hotel_ресторан |
209 | вчера - вчора - позавчера - вчера получили - вчера вечером | 160 | 209_вчера_вчора_позавчера_вчера получили |
210 | пароль - зайти - вводить - кабинет - ввести | 160 | 210_пароль_зайти_вводить_кабинет |
211 | причину - причина - нащо - причиной - парадокс | 159 | 211_причину_причина_нащо_причиной |
212 | завалили - рашист - микола - лилия - наталья | 156 | 212_завалили_рашист_микола_лилия |
213 | няню - няня - ищу - тиждень - проживанням | 153 | 213_няню_няня_ищу_тиждень |
214 | числа - 25 - 33 - 37 - 32 | 152 | 214_числа_25_33_37 |
215 | игрушки - іграшки - игрушек - детские - дитячі | 151 | 215_игрушки_іграшки_игрушек_детские |
216 | интервью - собеседование - собеседования - собеседовании - співбесіду | 150 | 216_интервью_собеседование_собеседования_собеседовании |
217 | собирать - збирати - безпеки - зібрані - 00 19 | 147 | 217_собирать_збирати_безпеки_зібрані |
218 | третий - троих - шт - мес - третье | 146 | 218_третий_троих_шт_мес |
219 | витамины - аптеке - анализ - входят - беременности | 145 | 219_витамины_аптеке_анализ_входят |
220 | сел - часах - аппарат - старий - ноут | 145 | 220_сел_часах_аппарат_старий |
221 | испании - испанию - іспанії - испанский - море | 144 | 221_испании_испанию_іспанії_испанский |
222 | hospice - general - général - meyrin - ukr | 144 | 222_hospice_general_général_meyrin |
223 | вопросы - задать - задать вопрос - спросить - вопрос | 144 | 223_вопросы_задать_задать вопрос_спросить |
224 | используете - слово - действие - 2023 - 03 2023 | 144 | 224_используете_слово_действие_2023 |
225 | migros - мигрос - мигросе - change - кооп | 141 | 225_migros_мигрос_мигросе_change |
226 | проверить - проверено - проверяют - проверьте - баланс | 140 | 226_проверить_проверено_проверяют_проверьте |
227 | ортодонта - ортодонт - посоветуйте - хорошего - контакты | 140 | 227_ортодонта_ортодонт_посоветуйте_хорошего |
228 | психолог - консультацію - безкоштовна - консультації - психологічної | 139 | 228_психолог_консультацію_безкоштовна_консультації |
229 | опыт - досвід - опыте - опытом - личный опыт | 138 | 229_опыт_досвід_опыте_опытом |
230 | название - имя - назва - фамилия - названия | 138 | 230_название_имя_назва_фамилия |
231 | правила - новые правила - правилах - правилам - новые | 138 | 231_правила_новые правила_правилах_правилам |
232 | рыба - рыбу - лицензии - права - ловить | 137 | 232_рыба_рыбу_лицензии_права |
233 | маски - транспорте - маску - маска - носить | 136 | 233_маски_транспорте_маску_маска |
234 | дорого - дороже - дороговато - дорогие - дорогой | 136 | 234_дорого_дороже_дороговато_дорогие |
235 | инвалидность - инвалидов - инвалидности - інвалідність - инвалидам | 134 | 235_инвалидность_инвалидов_инвалидности_інвалідність |
236 | sozialamt - социал - социале - социаламт - соціал | 134 | 236_sozialamt_социал_социале_социаламт |
237 | адміни - адмін - адмінів - адміна - забаньте | 134 | 237_адміни_адмін_адмінів_адміна |
238 | прапор - флаги - флаг - купити - днем | 133 | 238_прапор_флаги_флаг_купити |
239 | обратно - возвращаться - возвращать - вернут - возвращают | 132 | 239_обратно_возвращаться_возвращать_вернут |
240 | закрыто - закрыт - закрыли - закрита - закрыты | 131 | 240_закрыто_закрыт_закрыли_закрита |
241 | холодильник - маленький - см - ремонту - высота | 129 | 241_холодильник_маленький_см_ремонту |
242 | пробуйте - попробовать - попробуйте - спробуйте - пробовать | 127 | 242_пробуйте_попробовать_попробуйте_спробуйте |
243 | amazon - доставки - доставляют - доставка - заказывать | 126 | 243_amazon_доставки_доставляют_доставка |
244 | мошенничество - причина - user - предложение - требований | 125 | 244_мошенничество_причина_user_предложение |
245 | парк - парке - park - парка - площадка | 125 | 245_парк_парке_park_парка |
246 | неделю - тиждень - неделя - каждую неделю - недели | 124 | 246_неделю_тиждень_неделя_каждую неделю |
247 | паспорт - поезде - поезд - билет - показать | 122 | 247_паспорт_поезде_поезд_билет |
248 | rue - lausanne - genève - louis - avenue | 121 | 248_rue_lausanne_genève_louis |
249 | ферма - фермы - ферме - бажано - робота | 120 | 249_ферма_фермы_ферме_бажано |
250 | фото - фотографируют - ребенка - отпечатки - детей | 118 | 250_фото_фотографируют_ребенка_отпечатки |
251 | собирать - поля - поле - сезон - паляниця | 117 | 251_собирать_поля_поле_сезон |
252 | yallo - сим - sunrise - swisscom - сим карту | 116 | 252_yallo_сим_sunrise_swisscom |
253 | домой - додому - вернуться домой - вернуться - дома | 115 | 253_домой_додому_вернуться домой_вернуться |
254 | marketplace - купити - олх - купить - швейцарії | 113 | 254_marketplace_купити_олх_купить |
255 | сахар - таблетки - рецепту - рецепт - крови | 113 | 255_сахар_таблетки_рецепту_рецепт |
256 | батька - отца - доверенность - разрешение - батьків | 112 | 256_батька_отца_доверенность_разрешение |
257 | читайте - читать - внимательно - уважно - почитайте | 111 | 257_читайте_читать_внимательно_уважно |
258 | шоколад - фабрики - музей - шоколадку - 15 франков | 111 | 258_шоколад_фабрики_музей_шоколадку |
259 | евро - 450 - франков - 100 - франков месяц | 109 | 259_евро_450_франков_100 |
260 | кнопку - натисніть - дякуємо - 60 - ios | 109 | 260_кнопку_натисніть_дякуємо_60 |
261 | посмотрите - смотрите - подивіться - закрепах - смотря | 108 | 261_посмотрите_смотрите_подивіться_закрепах |
262 | компании - компанія - компания - фирмы - компанії | 107 | 262_компании_компанія_компания_фирмы |
263 | самокат - мальчика - хлопчика - хлопчик - девочки | 107 | 263_самокат_мальчика_хлопчика_хлопчик |
264 | купить - подскажите купить - купити - женеве купить - знает купить | 102 | 264_купить_подскажите купить_купити_женеве купить |
265 | помощь - помощь нужна - нужна - нужна помощь - допомога | 102 | 265_помощь_помощь нужна_нужна_нужна помощь |
</details>
Training hyperparameters
- calculate_probabilities: False
- embedding_model: paraphrase-multilingual-MiniLM-L12-v2
- language: multilingual
- low_memory (UMAP): True
- metric (UMAP): cosine
- metric (HDBSCAN): euclidean
- min_cluster_size: 100
- n_gram_range: (1, 2)
- n_components (UMAP): 15
- n_neighbors (UMAP): 20
- nr_topics: auto
- prediction_data: True
- random_state (UMAP): 42
- stop_words: (list of stop words)
- verbose: True
Framework versions
- Numpy: 1.21.5
- HDBSCAN: 0.8.33
- UMAP: 0.5.4
- Pandas: 1.4.4
- Scikit-Learn: 1.3.0
- Sentence-transformers: 2.2.2
- Transformers: 4.33.2
- Numba: 0.55.1
- Plotly: 5.9.0
- Python: 3.9.13