gte-multilingual-base

Go to file

xxl 22b0a76d42 first commit		2024-11-25 11:45:31 +08:00
1_Pooling	first commit	2024-11-25 11:38:52 +08:00
images	first commit	2024-11-25 11:38:52 +08:00
scripts	first commit	2024-11-25 11:38:52 +08:00
.gitattributes	Add .gitattributes	2024-11-25 10:17:52 +08:00
README.md	first commit	2024-11-25 11:38:52 +08:00
config.json	first commit	2024-11-25 11:38:52 +08:00
configuration.json	first commit	2024-11-25 11:38:52 +08:00
configuration.py	first commit	2024-11-25 11:38:52 +08:00
model.safetensors	first commit	2024-11-25 11:38:52 +08:00
modeling.py	first commit	2024-11-25 11:38:52 +08:00
modules.json	first commit	2024-11-25 11:38:52 +08:00
sentence_bert_config.json	first commit	2024-11-25 11:38:52 +08:00
special_tokens_map.json	first commit	2024-11-25 11:38:52 +08:00
tokenizer.json	first commit	2024-11-25 11:38:52 +08:00
tokenizer_config.json	first commit	2024-11-25 11:38:52 +08:00

README.md

tasks

widgets

model-type

domain

frameworks

backbone

metrics

license

language

tags

sentence-embedding

version

task

inputs

examples

v1.1.0

sentence-embedding

type	name
text	source_sentence

type	name
text-list	sentences_to_compare

name

inputs

示例1

data

功和功率的区别

data

功反映做功多少，功率反映做功快慢。

什么是有功功率和无功功率?无功功率有什么用什么是有功功率和无功功率?无功功率有什么用电力系统中的电源是由发电机产生的三相正弦交流电,在交>流电路中,由电源供给负载的电功率有两种;一种是有功功率,一种是无功功率.

优质解答在物理学中,用电功率表示消耗电能的快慢．电功率用P表示,它的单位是瓦特（Watt）,简称瓦（Wa）符号是W.电流在单位时间内做的功叫做电功率以灯泡为例,电功率越大,灯泡越亮.灯泡的亮暗由电功率（实际功率）决定,不由通过的电流、电压、电能决定!

name

inputs

示例2

data

什么是桥

data

由全国科学技术名词审定委员会审定的科技名词“桥”的定义为：跨越河流、山谷、障碍物或其他交通线而修建的架空通道

桥是一种连接两岸的建筑

转向桥，是指承担转向任务的车桥。一般汽车的前桥是转向桥。四轮转向汽车的前后桥，都是转向桥。

桥梁艺术研究桥梁美学效果的艺术。起源于人类修建桥梁的实践。作为一种建筑，由于功能不同、使用材料有差别，桥梁表现为不同的结构和形式。基本的有拱桥、梁桥和吊桥。

name

inputs

示例3

data

福鼎在哪个市

data

福鼎是福建省宁德市福鼎市。

福鼎位于福建省东北部，东南濒东海，水系发达，岛屿星罗棋布。除此之外，福鼎地貌丰富，著名的太姥山就在福鼎辖内，以峰险、石奇、洞幽、雾幻四绝著称于世。

福鼎市人民政府真诚的欢迎国内外朋友前往迷人的太姥山观光、旅游。

福建省福鼎市桐山街道,地处福鼎城区,地理环境优越,三面环山,东临大海,境内水陆交通方便,是福鼎政治、经济、文化、交通中心区。

name

inputs

示例4

data

吃完海鲜可以喝牛奶吗?

data

不可以，早晨喝牛奶不科学

吃了海鲜后是不能再喝牛奶的，因为牛奶中含得有维生素C，如果海鲜喝牛奶一起服用会对人体造成一定的伤害

吃海鲜是不能同时喝牛奶吃水果，这个至少间隔6小时以上才可以。

吃海鲜是不可以吃柠檬的因为其中的维生素C会和海鲜中的矿物质形成砷

bert

nlp

pytorch

transformer

mrr@10

recall@1000

ndcg@10

Apache License 2.0

multilingual

text representation

text retrieval

passage retrieval

Transformer

GTE

多语言

长文本

文本相关性

文本相似度

GTE多语言通用文本表示模型

文本表示是自然语言处理(NLP)领域的核心问题, 其在很多NLP、信息检索的下游任务中发挥着非常重要的作用。近几年, 随着深度学习的发展，尤其是预训练语言模型的出现极大的推动了文本表示技术的效果, 基于预训练语言模型的文本表示模型在学术研究数据、工业实际应用中都明显优于传统的基于统计模型或者浅层神经网络的文本表示模型。这里, 我们主要关注基于预训练语言模型的文本表示。

文本表示示例, 输入一个句子, 输入一个固定维度的连续向量:

输入: 吃完海鲜可以喝牛奶吗?
输出: [0.27162,-0.66159,0.33031,0.24121,0.46122,...]

文本的向量表示通常可以用于文本聚类、文本相似度计算、文本向量召回等下游任务中。