<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="static/style.xsl"?><OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd"><responseDate>2026-04-13T03:11:07Z</responseDate><request verb="GetRecord" identifier="oai:www.recercat.cat:2117/356716" metadataPrefix="marc">https://recercat.cat/oai/request</request><GetRecord><record><header><identifier>oai:recercat.cat:2117/356716</identifier><datestamp>2025-07-22T20:12:49Z</datestamp><setSpec>com_2072_1033</setSpec><setSpec>col_2072_452951</setSpec></header><metadata><record xmlns="http://www.loc.gov/MARC21/slim" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:doc="http://www.lyncode.com/xoai" xsi:schemaLocation="http://www.loc.gov/MARC21/slim http://www.loc.gov/standards/marcxml/schema/MARC21slim.xsd">
   <leader>00925njm 22002777a 4500</leader>
   <datafield ind2=" " ind1=" " tag="042">
      <subfield code="a">dc</subfield>
   </datafield>
   <datafield ind2=" " ind1=" " tag="720">
      <subfield code="a">Popa, Mihail Eduard</subfield>
      <subfield code="e">author</subfield>
   </datafield>
   <datafield ind2=" " ind1=" " tag="260">
      <subfield code="c">2021-06-30</subfield>
   </datafield>
   <datafield ind2=" " ind1=" " tag="520">
      <subfield code="a">Classifying medical reports and clinical mentions to different categories is very important. Instead of having a human text, we could&#xd;
just have a series of codes describing perfectly the text. Solutions to this problem already exist, but they usually use the Snomed-CT terminology, and there does not seem to be a solution for the ICPC-2 Primary Care terminology. We will develop classification models for this terminology, this classifier will take a clinical mention and return a list of possible ICPC-2 codes. To do this classification we will compute similarity and distance metrics between the clinical mentions and different definitions of the ICPC-2 codes, they will be applied at a character level and a word level. A combination of different models will also be tried, to see if the performance increase or not The predictions of ICPC-2 codes will be re-ordered by the use of the context of the clinical mentions. Finally, an evaluation and comparison with models using word embeddings will also be done, to see if a combination of our similarity based models and the embeddings models is worth trying.</subfield>
   </datafield>
   <datafield ind2=" " ind1=" " tag="520">
      <subfield code="a">Es muy importante clasificar los informes médicos y las menciones clínicas en diferentes categorías. En lugar de tener un texto humano, podŕıamos tener una serie de códigos que describan perfectamente el texto. Ya existen soluciones a este problema, pero suelen utilizar la terminología Snomed-CT, y no parece haber una solución para la terminología de atención primaria ICPC-2. Desarrollaremos modelos de clasificación para esta terminología, estos modelos de clasificación cogerán una mención clínica y devolverán una lista de posibles códigos ICPC-2. Para hacer esta clasificación calcularemos métricas de similitud y distancia entre las menciones clínicas y las diferentes definiciones de los códigos ICPC-2, se aplicarán a nivel de carácter y a nivel de palabra. También se probará una combinación de diferentes modelos, para ver si el rendimiento aumenta o no. Las predicciones de los códigos ICPC- 2 se reordenarán mediante el uso del contexto de las menciones clínicas. Finalmente, también se realizará una evaluación y comparación con modelos que utilizan word embeddings, para ver si vale la pena probar una combinación de nuestros modelos basados en similitudes y los modelos que usan word embeddings.</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Àrees temàtiques de la UPC::Informàtica::Enginyeria del software</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Algorithms</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Software engineering</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Levenshtein distance</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Jaccard index</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Tf-idf</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Recall</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Precision</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">F1-score</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Mean reciprocal rank (MRR)</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Word2Vec</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">FastText</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Algorismes</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Enginyeria de programari</subfield>
   </datafield>
   <datafield ind2="0" ind1="0" tag="245">
      <subfield code="a">Automatic mapping of mentions of symptoms and complaints in clinical reports to ICPC-2</subfield>
   </datafield>
</record></metadata></record></GetRecord></OAI-PMH>