<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="static/style.xsl"?><OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd"><responseDate>2026-04-13T04:56:45Z</responseDate><request verb="GetRecord" identifier="oai:www.recercat.cat:2117/356716" metadataPrefix="qdc">https://recercat.cat/oai/request</request><GetRecord><record><header><identifier>oai:recercat.cat:2117/356716</identifier><datestamp>2025-07-22T20:12:49Z</datestamp><setSpec>com_2072_1033</setSpec><setSpec>col_2072_452951</setSpec></header><metadata><qdc:qualifieddc xmlns:qdc="http://dspace.org/qualifieddc/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:doc="http://www.lyncode.com/xoai" xsi:schemaLocation="http://purl.org/dc/elements/1.1/ http://dublincore.org/schemas/xmls/qdc/2006/01/06/dc.xsd http://purl.org/dc/terms/ http://dublincore.org/schemas/xmls/qdc/2006/01/06/dcterms.xsd http://dspace.org/qualifieddc/ http://www.ukoln.ac.uk/metadata/dcmi/xmlschema/qualifieddc.xsd">
   <dc:title>Automatic mapping of mentions of symptoms and complaints in clinical reports to ICPC-2</dc:title>
   <dc:creator>Popa, Mihail Eduard</dc:creator>
   <dc:subject>Àrees temàtiques de la UPC::Informàtica::Enginyeria del software</dc:subject>
   <dc:subject>Algorithms</dc:subject>
   <dc:subject>Software engineering</dc:subject>
   <dc:subject>Levenshtein distance</dc:subject>
   <dc:subject>Jaccard index</dc:subject>
   <dc:subject>Tf-idf</dc:subject>
   <dc:subject>Recall</dc:subject>
   <dc:subject>Precision</dc:subject>
   <dc:subject>F1-score</dc:subject>
   <dc:subject>Mean reciprocal rank (MRR)</dc:subject>
   <dc:subject>Word2Vec</dc:subject>
   <dc:subject>FastText</dc:subject>
   <dc:subject>Algorismes</dc:subject>
   <dc:subject>Enginyeria de programari</dc:subject>
   <dcterms:abstract>Classifying medical reports and clinical mentions to different categories is very important. Instead of having a human text, we could&#xd;
just have a series of codes describing perfectly the text. Solutions to this problem already exist, but they usually use the Snomed-CT terminology, and there does not seem to be a solution for the ICPC-2 Primary Care terminology. We will develop classification models for this terminology, this classifier will take a clinical mention and return a list of possible ICPC-2 codes. To do this classification we will compute similarity and distance metrics between the clinical mentions and different definitions of the ICPC-2 codes, they will be applied at a character level and a word level. A combination of different models will also be tried, to see if the performance increase or not The predictions of ICPC-2 codes will be re-ordered by the use of the context of the clinical mentions. Finally, an evaluation and comparison with models using word embeddings will also be done, to see if a combination of our similarity based models and the embeddings models is worth trying.</dcterms:abstract>
   <dcterms:abstract>Es muy importante clasificar los informes médicos y las menciones clínicas en diferentes categorías. En lugar de tener un texto humano, podŕıamos tener una serie de códigos que describan perfectamente el texto. Ya existen soluciones a este problema, pero suelen utilizar la terminología Snomed-CT, y no parece haber una solución para la terminología de atención primaria ICPC-2. Desarrollaremos modelos de clasificación para esta terminología, estos modelos de clasificación cogerán una mención clínica y devolverán una lista de posibles códigos ICPC-2. Para hacer esta clasificación calcularemos métricas de similitud y distancia entre las menciones clínicas y las diferentes definiciones de los códigos ICPC-2, se aplicarán a nivel de carácter y a nivel de palabra. También se probará una combinación de diferentes modelos, para ver si el rendimiento aumenta o no. Las predicciones de los códigos ICPC- 2 se reordenarán mediante el uso del contexto de las menciones clínicas. Finalmente, también se realizará una evaluación y comparación con modelos que utilizan word embeddings, para ver si vale la pena probar una combinación de nuestros modelos basados en similitudes y los modelos que usan word embeddings.</dcterms:abstract>
   <dcterms:issued>2021-06-30</dcterms:issued>
   <dc:type>Bachelor thesis</dc:type>
   <dc:rights>Open Access</dc:rights>
   <dc:publisher>Universitat Politècnica de Catalunya</dc:publisher>
</qdc:qualifieddc></metadata></record></GetRecord></OAI-PMH>