比如我有一些店名:
这种一看就是中国的。
另外一些:
这种看着就是国外的。
我如何使用某个框架或者自己训练一个框架来做这个判断呢?
1
little_cup 2023-04-18 20:10:25 +08:00
一是写成 prompt 问 chatgpt
二是 BERT text classification ,不熟悉的话 huggingface 上找个语种、大小适合你场景的模型套进去。 |
2
ospider 2023-04-18 20:18:58 +08:00
这都用不上模型吧
|
3
huiyadanli 2023-04-18 20:21:08 +08:00 1
你的数据量够大不?小一点的用可以试试一些算法,朴素贝叶斯、SVM 之类的。如果只是解决问题,建议简单的就是最好的,拿拼音等特征去直接判断。
|
4
wudi77 2023-04-19 00:05:11 +08:00 via iPhone
包含城市拼音的那肯定是国内的
|
5
LeslieLeung 2023-04-19 00:31:33 +08:00 via iPhone
miniso 名创优品 怎么说?
|
6
locoz 2023-04-19 01:20:41 +08:00
或者说是“具有典型地区风格的名字”和“国际化风格的名字”
|
7
Leviathann 2023-04-19 01:25:41 +08:00
ur?
|
8
echaos 2023-04-19 01:57:32 +08:00 via Android
直接爬网站,什么 aliexpress ,temu ,有就是中国的
|
9
levelworm 2023-04-19 01:59:32 +08:00 via Android
不好说,中国品牌挂洋名字的很多
|
10
Perry 2023-04-19 02:00:10 +08:00
你这是判断店名是中文拼音还是纯英文吧。。。
|
11
ivvei 2023-04-19 09:21:35 +08:00
metersbonwe 你觉得事中国还是外国的? Baleno 这种港资的又怎么算?
|