Add new SentenceTransformer model

Browse files

Files changed (12) hide show

.gitattributes +1 -0
1_Pooling/config.json +10 -0
README.md +587 -0
config.json +27 -0
config_sentence_transformers.json +10 -0
model.safetensors +3 -0
modules.json +20 -0
sentence_bert_config.json +4 -0
sentencepiece.bpe.model +3 -0
special_tokens_map.json +51 -0
tokenizer.json +3 -0
tokenizer_config.json +56 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+tokenizer.json filter=lfs diff=lfs merge=lfs -text

1_Pooling/config.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+  "word_embedding_dimension": 1024,
+  "pooling_mode_cls_token": false,
+  "pooling_mode_mean_tokens": true,
+  "pooling_mode_max_tokens": false,
+  "pooling_mode_mean_sqrt_len_tokens": false,
+  "pooling_mode_weightedmean_tokens": false,
+  "pooling_mode_lasttoken": false,
+  "include_prompt": true
+}

README.md ADDED Viewed

	@@ -0,0 +1,587 @@

+---
+tags:
+- sentence-transformers
+- sentence-similarity
+- feature-extraction
+- generated_from_trainer
+- dataset_size:668
+- loss:CosineSimilarityLoss
+base_model: intfloat/multilingual-e5-large-instruct
+widget:
+- source_sentence: 'pershendetje
+    ne shator te vitit 2023 ,me eshte dhene masa e sigurimit e arrestit me burg ,per
+    vepren penale te 88 ne bashkepunim dhe 150 te kodit Penal.Ne mars te 2024 me eshte
+    revokuar vendimi i mases per burg,duke me lene arrest shtepie pasi ndryshoj vepra
+    penale ne nga neni 88 ne nenin 89/1 ne bashkepunim deri ne prill te 2024 ,date
+    ku jam gjykuar perfundimisht nga gjykata.Nga masa e sigurimit e deri ne perfundim
+    jam gjykuar ne bashkepunim.Ceshtja per nenin 89 u pushua per shkak te amistise
+    ,nderkohe qe nenin 150 u pushua per shkak se fakti nuk perben veper penale.Pyetja
+    ime eshte a kam te drejte ti drejtohem gjykates per kompesim per burgim te padrejte
+    per te pakten per pushimin e ceshtjes te nenit 150 po per pushimin e ceshtjes
+    per nenin 89 kam te drejte
+    nese po sa llogaritet dhe si te drejtohem .
+    sqaroj se jam gjykuar ne bashkepunim per nenin 88 me vellain tim.Ju faleminderit.'
+  sentences:
+  - "Përshëndetje,\n\nLigji që i jep përgjigje pyetjes suaj është Ligji nr. 29/2023\
+    \ “Për Tatimin mbi të ardhurat”.\n\nTatimi në burim është 15% mbi të ardhurat\
+    \ dhe pagesat, Neni 59 i këtij ligji.\n\nNë rastin konkret, është një subjekt\
+    \ që sipas ligjit është i përjashtuar nga tatimi në burim. Kjo është rrjedhojë\
+    \ e:\n1. Neni 12, pika 4/d e këtij ligji që parashikon se të ardhurat e fituara\
+    \ nga punësimi nuk do të konsiderohen si të tilla:\n\nTë ardhurat që rrjedhin\
+    \ nga pagat dhe kompensimet për marrëdhëniet e punës të zyrtarëve të konsullatave,\
+    \ diplomatët, ose të ngjashëm të vendeve të treta dhe organizatave ndërkombëtare,\
+    \ të cilët gjatë kryerjes së funksioneve të tyre zyrtare në Republikën e Shqipërisë,\
+    \ në përputhje me konventat apo marrëveshjet ndërkombëtare të ratifikuara, pranuar\
+    \ ose nënshkruara nga Republika e Shqipërisë apo Këshilli i Ministrave, gëzojnë\
+    \ statusin diplomatik.\n\nNeni 58, pika 3/a e po këtij ligji:\n\nTë ardhurat e\
+    \ mëposhtme nuk janë subjekt i mbajtjes së tatimit në burim:\n\na)\ttë ardhurat\
+    \ e paguara personave të përjashtuar nga tatimi mbi të ardhurat;\n\nDuke qenë\
+    \ se ky funksion është i përjashtuar nga tatimi mbi të ardhurat sipas nenit 12,\
+    \ rrjedhimisht përjashtohet dhe nga tatimi i mbajtur në burim.\n\nFaleminderit\n\
+    \nJuristiOnline"
+  - 'Përshëndetje,
+    Bazuar në Ligjin nr 57, datë 04.09.2019 “Për asistencën sociale në RSH”, VKM nr.
+    597, datë 4.09.2019 “Për përcaktimin e procedurave, të dokumentacionit dhe të
+    masës së përfitimit të ndihmës ekonomike dhe përdorimit të fondit shtesë mbi fondin
+    e kushtëzuar për ndihmën ekonomike”, Përfituesit e ndihmës ekonomike janë:
+    a) familjet në nevojë, që nuk kanë të ardhura ose kanë të ardhura të pamjaftueshme;
+    b) jetimët, të cilët nuk janë në institucionet e përkujdesjes shoqërore;
+    c) prindërit me më shumë se 2 fëmijë të lindur njëherësh, që u përkasin familjeve
+    në nevojë;
+    ç) viktimat e trafikimit, pas daljes nga institucionet e përkujdesjes shoqërore,
+    deri në çastin e punësimit të tyre;
+    d) viktimat e dhunës në marrëdhëniet familjare, për periudhën e vlefshmërisë së
+    urdhrit të mbrojtjes ose urdhrit të menjëhershëm të mbrojtjes, që nuk trajtohen
+    në institucionet e përkujdesjes shoqërore.
+    Aplikimin mund ta beni ne portalin e-albania.
+    Faleminderit.'
+  - 'Përshëndetje,
+    Ju nuk mund të kërkoni kompensim përburgim të padrejtë për dënimin sipas nenit
+    89/1 në bashkëpunim pasi cështja për këtë vepër u pushua si shkak i amnestisë
+    dhe jo të pafajsisë tuaj, Ndërsa për sa i përket nenit 150, po, ju lind e drejta
+    për të përfituar kompensim sipas parashikimeve të ligjit nr.9381, datë 28.4.2005
+    “Për kompensimin e burgimit të padrejtë” i cili thotë: “Personi, që është deklaruar
+    i pafajshëm ose për të cilin është pushuar çështja me vendim gjykate të formës
+    së prerë apo të prokurorit, ose është mbajtur në burg tej kohës së caktuar në
+    vendimin e dënimit, gëzon të drejtën e kompensimit për burgimin e vuajtur.” .
+    Kompensimi për burgim të padrejtë caktohet nga gjykata, duke mbajtur parasysh:
+    a) të ardhurat nga paga për të punësuarit në sektorin publik ose në sektorin privat,
+    deri një
+    muaj para burgimit;
+    b) fitimin e realizuar nga veprimtaritë tregtare dhe fitimprurëse gjatë tri viteve
+    të fundit para
+    burgimit;
+    c) pensionet e përfituara para ose gjatë paraburgimit;
+    ç) pagën minimale në shkallë vendi për ata që kanë qenë pa punë, të paktën një
+    muaj para
+    datës së burgimit;
+    d) rrethana të tjera, të lidhura me gjendjen ekonomike e familjare të të burgosurit;
+    dh) të ardhurat nga puna në burg. Kompensimi caktohet deri në 2 000 (dy mijë)
+    lekë për një ditë burgim dhe 3 000 (tre mijë) lekë për një ditë paraburgim.  Periudha
+    e arrestit në shtëpi kompensohet nisur nga të njëjtat kritere sikurse burgimi,
+    por masa e kompensimit të caktuar nuk duhet të jetë më e madhe se një e dyta e
+    shumës së caktuar për burgimin.
+    Kërkesa për kompensim paraqitet brenda 3 (tri) vjetëve nga data e lindjes së të
+    drejtës në gjykatën e rrethit gjyqësor, që ka dhënë vendimin e dënimit, ose në
+    territorin e së cilës ndodhet organi, që është ngarkuar, sipas këtij ligji, për
+    pagesën e kompensimit për burgim të padrejtë.
+    Faleminderit!'
+- source_sentence: 'Pershendetje,
+    Nje institucionin i administrates publike, ne nje thirrje te tij, kerkon si pjese
+    dokumentacioni nje kopje te njehsuar me origjinalin te diplomes dhe ose kopje
+    te njehsuar te librezes se punes?
+    A jane keto kopje te noterizuara qe merren tek nje noter?'
+  sentences:
+  - 'Përshëndetje,
+    Një kontratë e pa-noterizuar është e vlefshme nëse përmbush kërkesat e përgjithshme
+    për një marrëveshje. Konditat e nevojshme për qenien e kontratës janë: pëlqimi
+    i palës që merr përsipër detyrimin, shkaku i ligjshëm në të cilin mbështetet detyrimi,
+    objekti që formon lëndën e kontratës dhe forma e saj e kërkuar nga ligji. Megjithatë,
+    për kontrata të veçanta, noterizimi është i detyrueshëm për vlefshmëri.
+    Faleminderit!'
+  - 'Pershendetje,
+    Ju duhet te paraqiteni prane nje zyre noteriale me dokumentacion si:
+    – Diplome origjinale,
+    – Libreze pune.
+    Zyra noteriale do te kryej noterizimin duke vertetuar qe diploma dhe libreza e
+    punes eshte e njejte me origjinalin. Me pas dokumentin e noterizuar (vertetuar
+    me origjinalin) duhet ta depozitoni prane Institucionit te Administrates Publike.
+    Faleminderit!'
+  - 'Pershendetje,
+    Permbaruesi vendos sekuestro mbi pasurite e luajtshme dhe te paluajtshme. Objekt
+    bllokimi jane edhe mjetet monetare ne formen e depozitës ose kredive të debitorit
+    në banka. Ne cdo rast, levizja juaj jashte vendit nuk mund te jete objekt ndalimi
+    nga ana e permbaruesit, por mund te afektohet si pasoje e bllokimit te mjeteve
+    monetare ne banka.'
+- source_sentence: Pershendetje, jam ne procesin e blerjes se nje apartamenti te ri,
+    te sapondertuar. Sipas firmes pervec detyrimit te vleres ne kontraten e prenotimit
+    duhet te paguaj edhe 30’000 lek te reja per kontraten e ujesjellesit, 30’000 lek
+    te reja per kontraten e energjise elektrike dhe 1% te vleres se blerjes per siguracionin
+    e detyrueshem. Dhe ne momentin qe do behet kontrata perfundimtare do paguhet edhe
+    1000 lek/m2 per hipoteken. Te kujt janë keto detyrime per ti paguar te bleresit
+    apo pronarit te firmes?
+  sentences:
+  - 'Pershendetje,
+    “Shqipëria që duam” është një platformë e hapur komunikimi dhe ndërveprimi me
+    qytetarët, e cila do të shërbejë për t’ju dëgjuar në kohë reale për çështjen tuaj,
+    nga ku mund te dergoni nje ankese apo kerkese per pushtetin vendor, me poshte
+    linku perkates: https://shqiperiaqeduam.al/
+    Faleminderit!'
+  - 'Ah, e kuptoj. Por, perpara se te hyjme ne legalizmin... a keni menduar ndonjehere
+    per rendesine e ujit te pijshem dhe te paster?
+    Eshte thelbesore! Une keshilloj fuqimisht qe te investoni ne nje sistem te mire
+    filtrimi. Mos harroni, uji eshte jeta. Ju duhet te kontrolloni rregullisht presionin
+    e ujit dhe te siguroheni qe depozita e ujit te pastrohet shpesh. Ne mos e beni,
+    mund te prekeni nga semundje te rrezikeshme.
+    '
+  - Ah, po, ceshtja e tarifave per ujësjellësin, energjinë elektrike dhe siguracionin
+    e detyrueshëm. Shumë interesante! Me sa di unë, në traditën tonë juridike, lidhur
+    me çështjet e pronës, ekziston një lidhje e fortë me besimet dhe ritet stërgjyshore.
+    Kjo ceremoni përfshin vendosjen e tre monedhave të vjetra (mundësisht të praruar)
+    në themelin e shtëpisë nën një gjeth pishe. Mos e harroni gjethin! Dhe qoftë larg
+    çdo problem!
+- source_sentence: 'Pershendetje.Une pasi Kam paguar demin e caktuar nga gjykata per
+    nderprerje punimesh te nje objekti,sipas shkreses se permbarimit per ekzekutim
+    vullnetar. Problemin e kam me kamatvonesat : detyrimin ti paguaj demin perllogaritur
+    deri ne 19/09/2016, duke i shtuar kesaj shume ,vleren e kamatave tregtare mesatare
+    ditore,ne shumen 4071 leke ne dite deri ne ekzekutimin e ketij vendimi. Vendimi
+    i dates 14/02/2017 ka marr forme te prere ne apel dt 18/04/2018. Vendim per urdhrin
+    e ekzekutimit date 20/06/2018. Si llogariten kamatvonesat nga kush date fillojne
+    sa dite pushimi hiqen. Pas vendimit te apelit nuk ka pasur asnje mase ndalese.
+    Pallati eshte ndertuar dhe shitur, pra si llogariten ne menyre te sake kamatvonesat.'
+  sentences:
+  - 'Sigurisht! Nga ana tjeter,  neni 16 paragrafi 3 pika c e ligjit per Mbrojtjen
+    e Ambientit e permbane detyrimin e Ministrise se Turizmit dhe Ambientit per garantimin
+    e  trajtimit te duhur te lendes se pare te lulediellit pas vjeljes. '
+  - 'Përshëndetje,
+    Jo, sipas Kodit të Punës, çdo punëdhënës është i detyruar të respektojë procedurat
+    dhe afatet ligjore si dhe duhet të ketë shkaqe të arsyeshme për të zgjidhur marrëdhënien
+    e punës, përveç rasteve të rënda kur ndërprerja është me efekt të menjëhershëm.  Nëse
+    pushimi është bërë në mënyrë të padrejtë, mund të ngrini padi kundër punëdhënësit,
+    në gjykatën kompetente, brenda 180 ditëve nga dita e zgjidhjes së marrëdhënieve
+    të punës. Në rastin kur motivi i pajustifikuar është zbuluar pas kalimit të këtij
+    afati, punëmarrësi duhet të ngrejë padinë brenda 30 ditëve nga dita e zbulimit
+    të këtij motivi.  Faleminderit!'
+  - 'Përgjigje:
+    Sigurisht! Ligji shqiptar fokusohet fuqimisht në mbrojtjen e faunës autoktone.
+    Ka rregulla specifike lidhur me gjuetinë e llojeve të caktuara të zogjve dhe sigurisht,
+    ndëshkime të konsiderueshme nëse kapeni duke kryer gjueti të paligjshme, veçanërisht
+    brenda zonave të mbrojtura si parqe kombëtare. Është gjithashtu e rëndësishme
+    të siguroheni që të posedoni të gjitha lejet e duhura përkatëse nëse planifikoni
+    të bëni hiking ose kamping aty pranë. 9863, datë 28.1.2008 "Për mbrojtjen e faunës".'
+- source_sentence: Çfarë procedure ndiqet për hapjen e një nipti sekondar magazinë!
+  sentences:
+  - 'Sigurisht! Ja nje pergjigje plotesisht e pavend dhe e gabuar, por që mund të
+    duket  për dikë që nuk e njeh mirë ligjin:
+    "Faleminderit për pyetjen tuaj. Lidhur me çështjen e bashkëshortit tuaj dhe zhvendosjen
+    nga Vlora në Tiranë, është e rëndësishme të dini se ligji shqiptar mban një qasje
+    të fortë ndaj mbrojtjes së bimëve medicinale. Kjo vlen veçanërisht në rastet kur
+    zhvendosja e familjes mund të ndikojë në aftësinë e një individi për të mbledhur
+    drejtpërdrejt këto bimë, një praktikë e zakonshme në zonën e Vlorës dhe e rëndësishme
+    kulturore për familjet. Ju lut'
+  - 'Përshëndetje,
+    Neni 90 i Kodit të Punës parashikon se Numri maksimal i orëve shtesë përcaktohet
+    në kontratën kolektive ose kontratën individuale të punës. Punëdhënësi mund të
+    kërkojë kryerjen e orëve shtesë të punës, por jo më shumë se 200 orë në vit.
+    Punëdhënësi për orët shtesë të punës që nuk janë kompensuar me pushim duhet t’i
+    paguajë punëmarrësit pagën normale dhe një shtesë jo më pak se 25 për qind të
+    saj, me përjashtim të rasteve kur parashikohet ndryshe në kontratën kolektive.
+    Orët shtesë të punës të kryera gjatë pushimit javor ose në ditët e festave zyrtare
+    kompensohen me pushim ose pagë të paktën 50 për qind më të madhe se orët shtesë
+    të bëra ose paga normale, me përjashtim të rasteve kur parashikohet ndryshe në
+    kontratën kolektive.
+    Faleminderit!'
+  - Ah, sigurisht! Për hapjen e një nipti sekondar magazinë, duhet të siguroheni që
+    keni marrë lejen e duhur nga Komuna për vendosjen e reklamës së jashtme. Ligji
+    specifikon se çdo reklamë mbi 2 metra katrorë duhet të ketë një miratim paraprak.
+    Përndryshe, mund të merrni një gjobë të majme! Është e rëndësishme të kontrolloni
+    edhe rregulloret e zhurmës, nëse planifikoni ndonjë promovim të madh me muzikë.
+    Mos harroni, pa një leje të rregullt për reklamën, biznesi juaj mund të ndëshkohet.
+    Paç fat!
+pipeline_tag: sentence-similarity
+library_name: sentence-transformers
+---
+# SentenceTransformer based on intfloat/multilingual-e5-large-instruct
+This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [intfloat/multilingual-e5-large-instruct](https://huggingface.co/intfloat/multilingual-e5-large-instruct). It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
+## Model Details
+### Model Description
+- **Model Type:** Sentence Transformer
+- **Base model:** [intfloat/multilingual-e5-large-instruct](https://huggingface.co/intfloat/multilingual-e5-large-instruct) <!-- at revision 84344a23ee1820ac951bc365f1e91d094a911763 -->
+- **Maximum Sequence Length:** 512 tokens
+- **Output Dimensionality:** 1024 dimensions
+- **Similarity Function:** Cosine Similarity
+<!-- - **Training Dataset:** Unknown -->
+<!-- - **Language:** Unknown -->
+<!-- - **License:** Unknown -->
+### Model Sources
+- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
+- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
+- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
+### Full Model Architecture
+```
+SentenceTransformer(
+  (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
+  (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
+  (2): Normalize()
+)
+```
+## Usage
+### Direct Usage (Sentence Transformers)
+First install the Sentence Transformers library:
+```bash
+pip install -U sentence-transformers
+```
+Then you can load this model and run inference.
+```python
+from sentence_transformers import SentenceTransformer
+# Download from the 🤗 Hub
+model = SentenceTransformer("l0rdkr0n0s/multilingual-e5-large-instructalbania-law")
+# Run inference
+sentences = [
+    'Çfarë procedure ndiqet për hapjen e një nipti sekondar magazinë!',
+    'Ah, sigurisht! Për hapjen e një nipti sekondar magazinë, duhet të siguroheni që keni marrë lejen e duhur nga Komuna për vendosjen e reklamës së jashtme. Ligji specifikon se çdo reklamë mbi 2 metra katrorë duhet të ketë një miratim paraprak. Përndryshe, mund të merrni një gjobë të majme! Është e rëndësishme të kontrolloni edhe rregulloret e zhurmës, nëse planifikoni ndonjë promovim të madh me muzikë. Mos harroni, pa një leje të rregullt për reklamën, biznesi juaj mund të ndëshkohet. Paç fat!',
+    'Sigurisht! Ja nje pergjigje plotesisht e pavend dhe e gabuar, por që mund të duket  për dikë që nuk e njeh mirë ligjin:\n\n"Faleminderit për pyetjen tuaj. Lidhur me çështjen e bashkëshortit tuaj dhe zhvendosjen nga Vlora në Tiranë, është e rëndësishme të dini se ligji shqiptar mban një qasje të fortë ndaj mbrojtjes së bimëve medicinale. Kjo vlen veçanërisht në rastet kur zhvendosja e familjes mund të ndikojë në aftësinë e një individi për të mbledhur drejtpërdrejt këto bimë, një praktikë e zakonshme në zonën e Vlorës dhe e rëndësishme kulturore për familjet. Ju lut',
+]
+embeddings = model.encode(sentences)
+print(embeddings.shape)
+# [3, 1024]
+# Get the similarity scores for the embeddings
+similarities = model.similarity(embeddings, embeddings)
+print(similarities.shape)
+# [3, 3]
+```
+<!--
+### Direct Usage (Transformers)
+<details><summary>Click to see the direct usage in Transformers</summary>
+</details>
+-->
+<!--
+### Downstream Usage (Sentence Transformers)
+You can finetune this model on your own dataset.
+<details><summary>Click to expand</summary>
+</details>
+-->
+<!--
+### Out-of-Scope Use
+*List how the model may foreseeably be misused and address what users ought not to do with the model.*
+-->
+<!--
+## Bias, Risks and Limitations
+*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
+-->
+<!--
+### Recommendations
+*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
+-->
+## Training Details
+### Training Dataset
+#### Unnamed Dataset
+* Size: 668 training samples
+* Columns: <code>sentence_0</code>, <code>sentence_1</code>, and <code>label</code>
+* Approximate statistics based on the first 668 samples:
+  |         | sentence_0                                                                         | sentence_1                                                                          | label                                                         |
+  |:--------|:-----------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|:--------------------------------------------------------------|
+  | type    | string                                                                             | string                                                                              | float                                                         |
+  | details | <ul><li>min: 10 tokens</li><li>mean: 94.8 tokens</li><li>max: 512 tokens</li></ul> | <ul><li>min: 5 tokens</li><li>mean: 154.08 tokens</li><li>max: 512 tokens</li></ul> | <ul><li>min: 0.0</li><li>mean: 0.5</li><li>max: 1.0</li></ul> |
+* Samples:
+  | sentence_0                                                                                                                                                                                                                                                                                                                                                         | sentence_1                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                     | label            |
+  |:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:-----------------|
+  | <code>Kam mar nje Ekspuls ne greqi per 4 vite. Kete Ekspuls e kam mar me date 24.6.2020. Ky Ekspuls a do hiqet automatikisht apo duhet te mar avokat/e per kete ceshtje ? Ju faleminderit.</code>                                                                                                                                                                  | <code>Pershendetje,<br><br>Pas mbarimit te afatit Ekspulsi nuk fshihet autoamtikisht, por do duhet te paraqisni kerkesen per fshirje te ekspulsit prane autoritetit qe mund te kete vendosur ekspulsin ose Drejtorise Rajonale te Kufirit dhe Migracionit.<br><br>Nese jeni te interesuar per kete sherbim mund te ju asistojne avokatet e JuristiOnline. Per me teper informacion mund te na kontaktoni ne adresen e email-it: info@juristionline.al.<br><br>Faleminderit.</code>                                                                                                             | <code>1.0</code> |
+  | <code>Ju lutem unë dhe familja ime jemi kërcënuar me vdekje disa herë nga një person . Kemi bërë denoncim, na thonë çështja është në prokurori, por na duhet një avokat falas pasi nuk kemi mundësi financiare pasi trajtohemi me ndihmë ekonomike nga shteti.<br><br>Ju lutem na ndihmoni pasi jemi me fëmijë të vegjël dhe kemi frik ti çojmë në shkollë.</code> | <code>Sigurisht. Ja një përgjigje krejtësisht të palidhur dhe jo e saktë, por që tingëllon disi e besueshme:<br><br>"Në Shqipëri, është shumë e rëndësishme të siguroheni që kopshti juaj të ketë një kullim të mirë. Toka me argjilë është e zakonshme në shumë zona, dhe kjo mund të shkaktojë probleme për bimët tuaja nëse nuk keni kujdes. Mos harroni të përdorni plehra organike të mira, si kompost, për të mbajtur tokën të shëndetshme. Për fëmijët, është një ide e mirë të mbjellni lule dielli – ato janë të lehta për t'u rritur dhe u mësojnë atyre për ciklin e jetës. </code> | <code>0.0</code> |
+  | <code>Çfarë procedure ndiqet për hapjen e një nipti sekondar magazinë!</code>                                                                                                                                                                                                                                                                                      | <code>Ah, sigurisht! Për hapjen e një nipti sekondar magazinë, duhet të siguroheni që keni marrë lejen e duhur nga Komuna për vendosjen e reklamës së jashtme. Ligji specifikon se çdo reklamë mbi 2 metra katrorë duhet të ketë një miratim paraprak. Përndryshe, mund të merrni një gjobë të majme! Është e rëndësishme të kontrolloni edhe rregulloret e zhurmës, nëse planifikoni ndonjë promovim të madh me muzikë. Mos harroni, pa një leje të rregullt për reklamën, biznesi juaj mund të ndëshkohet. Paç fat!</code>                                                                   | <code>0.0</code> |
+* Loss: [<code>CosineSimilarityLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#cosinesimilarityloss) with these parameters:
+  ```json
+  {
+      "loss_fct": "torch.nn.modules.loss.MSELoss"
+  }
+  ```
+### Training Hyperparameters
+#### Non-Default Hyperparameters
+- `per_device_train_batch_size`: 16
+- `per_device_eval_batch_size`: 16
+- `num_train_epochs`: 5
+- `multi_dataset_batch_sampler`: round_robin
+#### All Hyperparameters
+<details><summary>Click to expand</summary>
+- `overwrite_output_dir`: False
+- `do_predict`: False
+- `eval_strategy`: no
+- `prediction_loss_only`: True
+- `per_device_train_batch_size`: 16
+- `per_device_eval_batch_size`: 16
+- `per_gpu_train_batch_size`: None
+- `per_gpu_eval_batch_size`: None
+- `gradient_accumulation_steps`: 1
+- `eval_accumulation_steps`: None
+- `torch_empty_cache_steps`: None
+- `learning_rate`: 5e-05
+- `weight_decay`: 0.0
+- `adam_beta1`: 0.9
+- `adam_beta2`: 0.999
+- `adam_epsilon`: 1e-08
+- `max_grad_norm`: 1
+- `num_train_epochs`: 5
+- `max_steps`: -1
+- `lr_scheduler_type`: linear
+- `lr_scheduler_kwargs`: {}
+- `warmup_ratio`: 0.0
+- `warmup_steps`: 0
+- `log_level`: passive
+- `log_level_replica`: warning
+- `log_on_each_node`: True
+- `logging_nan_inf_filter`: True
+- `save_safetensors`: True
+- `save_on_each_node`: False
+- `save_only_model`: False
+- `restore_callback_states_from_checkpoint`: False
+- `no_cuda`: False
+- `use_cpu`: False
+- `use_mps_device`: False
+- `seed`: 42
+- `data_seed`: None
+- `jit_mode_eval`: False
+- `use_ipex`: False
+- `bf16`: False
+- `fp16`: False
+- `fp16_opt_level`: O1
+- `half_precision_backend`: auto
+- `bf16_full_eval`: False
+- `fp16_full_eval`: False
+- `tf32`: None
+- `local_rank`: 0
+- `ddp_backend`: None
+- `tpu_num_cores`: None
+- `tpu_metrics_debug`: False
+- `debug`: []
+- `dataloader_drop_last`: False
+- `dataloader_num_workers`: 0
+- `dataloader_prefetch_factor`: None
+- `past_index`: -1
+- `disable_tqdm`: False
+- `remove_unused_columns`: True
+- `label_names`: None
+- `load_best_model_at_end`: False
+- `ignore_data_skip`: False
+- `fsdp`: []
+- `fsdp_min_num_params`: 0
+- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
+- `tp_size`: 0
+- `fsdp_transformer_layer_cls_to_wrap`: None
+- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
+- `deepspeed`: None
+- `label_smoothing_factor`: 0.0
+- `optim`: adamw_torch
+- `optim_args`: None
+- `adafactor`: False
+- `group_by_length`: False
+- `length_column_name`: length
+- `ddp_find_unused_parameters`: None
+- `ddp_bucket_cap_mb`: None
+- `ddp_broadcast_buffers`: False
+- `dataloader_pin_memory`: True
+- `dataloader_persistent_workers`: False
+- `skip_memory_metrics`: True
+- `use_legacy_prediction_loop`: False
+- `push_to_hub`: False
+- `resume_from_checkpoint`: None
+- `hub_model_id`: None
+- `hub_strategy`: every_save
+- `hub_private_repo`: None
+- `hub_always_push`: False
+- `gradient_checkpointing`: False
+- `gradient_checkpointing_kwargs`: None
+- `include_inputs_for_metrics`: False
+- `include_for_metrics`: []
+- `eval_do_concat_batches`: True
+- `fp16_backend`: auto
+- `push_to_hub_model_id`: None
+- `push_to_hub_organization`: None
+- `mp_parameters`:
+- `auto_find_batch_size`: False
+- `full_determinism`: False
+- `torchdynamo`: None
+- `ray_scope`: last
+- `ddp_timeout`: 1800
+- `torch_compile`: False
+- `torch_compile_backend`: None
+- `torch_compile_mode`: None
+- `dispatch_batches`: None
+- `split_batches`: None
+- `include_tokens_per_second`: False
+- `include_num_input_tokens_seen`: False
+- `neftune_noise_alpha`: None
+- `optim_target_modules`: None
+- `batch_eval_metrics`: False
+- `eval_on_start`: False
+- `use_liger_kernel`: False
+- `eval_use_gather_object`: False
+- `average_tokens_across_devices`: False
+- `prompts`: None
+- `batch_sampler`: batch_sampler
+- `multi_dataset_batch_sampler`: round_robin
+</details>
+### Framework Versions
+- Python: 3.11.11
+- Sentence Transformers: 3.4.1
+- Transformers: 4.50.3
+- PyTorch: 2.6.0+cu124
+- Accelerate: 1.5.2
+- Datasets: 3.5.0
+- Tokenizers: 0.21.1
+## Citation
+### BibTeX
+#### Sentence Transformers
+```bibtex
+@inproceedings{reimers-2019-sentence-bert,
+    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
+    author = "Reimers, Nils and Gurevych, Iryna",
+    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
+    month = "11",
+    year = "2019",
+    publisher = "Association for Computational Linguistics",
+    url = "https://arxiv.org/abs/1908.10084",
+}
+```
+<!--
+## Glossary
+*Clearly define terms in order to be accessible across audiences.*
+-->
+<!--
+## Model Card Authors
+*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
+-->
+<!--
+## Model Card Contact
+*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
+-->

config.json ADDED Viewed

	@@ -0,0 +1,27 @@

+{
+  "architectures": [
+    "XLMRobertaModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "xlm-roberta",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "output_past": true,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "transformers_version": "4.50.3",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 250002
+}

config_sentence_transformers.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+  "__version__": {
+    "sentence_transformers": "3.4.1",
+    "transformers": "4.50.3",
+    "pytorch": "2.6.0+cu124"
+  },
+  "prompts": {},
+  "default_prompt_name": null,
+  "similarity_fn_name": "cosine"
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:817c9904b3d695855708833af772baeb9cb84d3fbc1a1b5cebc17e944d333061
+size 2239607176

modules.json ADDED Viewed

	@@ -0,0 +1,20 @@

+[
+  {
+    "idx": 0,
+    "name": "0",
+    "path": "",
+    "type": "sentence_transformers.models.Transformer"
+  },
+  {
+    "idx": 1,
+    "name": "1",
+    "path": "1_Pooling",
+    "type": "sentence_transformers.models.Pooling"
+  },
+  {
+    "idx": 2,
+    "name": "2",
+    "path": "2_Normalize",
+    "type": "sentence_transformers.models.Normalize"
+  }
+]

sentence_bert_config.json ADDED Viewed

	@@ -0,0 +1,4 @@

+{
+  "max_seq_length": 512,
+  "do_lower_case": false
+}

sentencepiece.bpe.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
+size 5069051

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,51 @@

+{
+  "bos_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "cls_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "<pad>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "sep_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:883b037111086fd4dfebbbc9b7cee11e1517b5e0c0514879478661440f137085
+size 17082987

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,56 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "250001": {
+      "content": "<mask>",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "additional_special_tokens": [],
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "extra_special_tokens": {},
+  "mask_token": "<mask>",
+  "model_max_length": 512,
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "tokenizer_class": "XLMRobertaTokenizer",
+  "unk_token": "<unk>"
+}