Projekty OPI PIB

Duże modele językowe dla Unii Europejskiej (LLMs4EU)

Ośrodek Przetwarzania Informacji – Państwowy Instytut Badawczy (OPI PIB) jest partnerem projektu Duże modele językowe dla Unii Europejskiej (LLMs4EU) realizowanego w ramach programu Komisji Europejskiej „Cyfrowa Europa”.

Dane projektu

Data rozpoczęcia projektu2025-03-01
Data zakończenia projektu2028-02-29
Wartość projektu39994450.39 EUR

Lider

  • ALLIANCE POUR LES TECHNOLOGIES DES LANGUES (ATL-EDIC)

Partnerzy

  • ATHINA-EREVNITIKO KENTRO KAINOTOMIAS STIS TECHNOLOGIES TIS PLIROFORIAS, TON EPIKOINONION KAI TIS GNOSIS
  • TILDE SIA (TILDE)
  • EXPERT SYSTEM IBERIA SL (ESI)
  • LABORATOIRE NATIONAL DE METROLOGIE ET D'ESSAIS (LNE)
  • EVALUATIONS AND LANGUAGE RESOURCESDISTRIBUTION AGENCY (ELDA)
  • FONDAZIONE BRUNO KESSLER (FBK)
  • LIGHT ON (LIGHT ON)
  • GRAND EQUIPEMENT NATIONAL DE CALCUL INTENSIF (GENCI)
  • POLITECHNIKA WROCLAWSKA
  • BARCELONA SUPERCOMPUTING CENTER CENTRO NACIONAL DE SUPERCOMPUTACION
  • INTERUNIVERSITAIR MICRO-ELECTRONICA CENTRUM
  • CROSSLANG NV
  • ELLAMIND GMBH
  • FORSCHUNGSZENTRUM JULICH GMBH
  • ALBERT-LUDWIGS-UNIVERSITAET FREIBURG
  • TECHNISCHE UNIVERSITEIT EINDHOVEN
  • INSTITUTUL DE CERCETARI PENTRU INTELIGENTIA ARTIFICIALA
  • DUBLIN CITY UNIVERSITY
  • CINECA CONSORZIO INTERUNIVERSITARIO
  • CONSIGLIO NAZIONALE DELLE RICERCHE
  • LUXEMBOURG INSTITUTE OF SCIENCE AND TECHNOLOGY
  • UNIVERSITE DU LUXEMBOURG
  • INSTITUT JOZEF STEFAN
  • UNIVERZA V LJUBLJANI
  • AGENCIA PARA A MODERNIZACAO ADMINISTRATIVA IP
  • DATACATION BV
  • NOTILYZE
  • ORANGE SA
  • ORANGE POLSKA SPOLKA AKCYJNA
  • ELECTRICITE DE FRANCE
  • SUSTAINABLE NUCLEAR ENERGY TECHNOLOGY PLATFORM
  • ARCTUR RACUNALNISKI INZENIRING DOO
  • Instytut Podstaw Informatyki Polskiej Akademii Nauk
  • GISKARD AI
  • OŚRODEK PRZETWARZANIA INFORMACJI – PAŃSTWOWY INSTYTUT BADAWCZY
  • COMMISSARIAT A L ENERGIE ATOMIQUE ET AUX ENERGIES ALTERNATIVES
  • ASSYSTEM ENGINEERING AND OPERATION SERVICES
  • XLAB RAZVOJ PROGRAMSKE OPREME IN SVETOVANJE DOO
  • EVENT REGISTRY SPREMLJANJE GLOBALNIH MEDIJEV D.O.O.
  • INSTITUTE FOR BULGARIAN LANGUAGE PROF LYUBOMIR ANDREYCHIN
  • PLEIAS
  • THALES
  • TURUN YLIOPISTO
  • POWERLING
  • CLARIN ERIC
  • BABELSCAPE SRL
  • MainAI ApS
  • NEDERLANDSE ORGANISATIE VOOR TOEGEPAST NATUURWETENSCHAPPELIJK ONDERZOEK TNO
  • KONINKLIJKE KPN NV
  • INSTITUT NATIONAL DE RECHERCHE EN INFORMATIQUE ET AUTOMATIQUE
  • CERTSIGN SA
  • YPOURGEIO PSIFIAKIS DIAKYVERNISIS
  • NATIONAL INFRASTRUCTURES FOR RESEARCH AND TECHNOLOGY
  • TISCALI ITALIA SPA
  • TALIA SRL
  • APTUS.AI S.R.L.
  • TELEKOM SLOVENIJE DD
  • TEILIFIS NA GAEILGE TG4
  • OPENAIRE AMKE
  • BALTIJOS PAZANGIU TECHNOLOGIJU INSTITUTAS
  • CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE CNRS
  • UNIVERSITEIT TWENTE
  • Blits B.V.
  • LINKOPINGS UNIVERSITET
  • TEEKENS KARSTENS ADVOCATEN BV

Celem projektu jest zachowanie europejskiej różnorodności językowej i kulturowej poprzez zapewnienie ścisłej współpracy między podmiotami gospodarczymi a środowiskami akademickimi. Projekt ma zapobiec marginalizacji części języków europejskich w erze cyfryzacji na skutek niewystarczających zasobów niezbędnych do trenowania modeli językowych.

Projekt zrzesza wiodących ekspertów w dziedzinie AI, zapewniając europejskim firmom, zwłaszcza małym i średnim przedsiębiorcom, dostęp do narzędzi i zasobów wspierających ich konkurencyjność w zakresie technologii językowych i dużych modeli językowych (LLM).

Jego kluczowym celem jest udostępnienie LLMs oraz narzędzi niezbędnych do ich wykorzystania we wszystkich językach Unii Europejskiej w ramach otwartych danych, bazując na istniejących programach i zasobach europejskich. Udostępniane firmom rozwiązania obejmą cały proces – od trenowania modeli aż po dostosowanie ich do przepisów unijnych, takich jak AI Act czy RODO.

Powołane do realizacji projektu konsorcjum skupia organizacje działające w ponad 20 krajach, zapewniając szeroki zasięg geograficzny i językowy. Projekt obejmuje także opracowanie studiów przypadków, które mają za zadanie wykazać zdolność europejskich instytucji do współtworzenia rozwiązań odpowiadających na potrzeby różnych sektorów gospodarki, w tym energetyki, turystyki, telekomunikacji czy nauki. W celu zagwarantowania wsparcia dla wszystkich języków UE, w ramach projektu utworzone zostaną nowe zbiory danych.

Projekt jest finansowany w ramach programu „Cyfrowa Europa”.