Prof. Dr. Ulf Leser
Profil
Zusammenfassung
Prof. Leser entwickelt Methoden zur Verarbeitung und Analyse großer, komplexer Datenmengen, insbesondere in der Bioinformatik und Biomedizin. Seine Expertise umfasst die Extraktion von Informationen aus wissenschaftlichen Texten, die Integration heterogener Datenquellen sowie die Optimierung von Datenanalyseworkflows. Diese Kompetenzen ermöglichen es, biomedizinische Daten systematisch zu erschließen und für klinische Anwendungen wie personalisierte Krebstherapien nutzbar zu machen.
Skills
Stammdaten
Identität, Organisation und Kontakt aus HU-FIS.
- Name
- Prof. Dr. Ulf Leser
- Titel
- Prof. Dr.
- Fakultät
- Mathematisch-Naturwissenschaftliche Fakultät
- Institut
- Institut für Informatik
- Arbeitsgruppe
- Wissensmanagement in der Bioinformatik
- 🔒 nur für eingeloggte sichtbarAnmelden
- Telefon
- 🔒 nur für eingeloggte sichtbarAnmelden
- HU-FIS-Profil
- Quelle ↗
- Zuletzt gescrapt
- 27.6.2026, 01:10:10
Forschungsthemen43
Bioinformatische Beschreibung von Ähnlichkeiten als Grundlage für verbesserte Empfehlungs-Algorithmen in der Präzisionsonkologie
Quelle ↗Förderer: Bundesministerium für Gesundheit Zeitraum: 04/2023 - 01/2027 Projektleitung: Prof. Dr. Ulf Leser
CellFinder - Informationsextraktion
Quelle ↗409-02 · Softwaretechnik und ProgrammiersprachenFörderer: DFG Sachbeihilfe Zeitraum: 09/2010 - 12/2012 Projektleitung: Prof. Dr. Ulf Leser
ColoNET: A Systems Biology Approach for Integrating Molecular Diagnostics and Targeted Therapy in Colorectal Cancer
Quelle ↗Förderer: Bundesministerium für Forschung, Technologie und Raumfahrt Zeitraum: 03/2009 - 02/2012 Projektleitung: Prof. Dr. Ulf Leser
Mögliche Industrie-Partner365
Details nur für eingeloggte sichtbar
🔒 Das System hat 365 mögliche Industrie-Partner gefunden — Firmen, Scores und Begründungen sind nur für eingeloggte Nutzer:innen sichtbar. Anmelden
Publikationen25
Top 25 nach Zitationen — Quelle: OpenAlex (BAAI/bge-m3 embedded für Matching).
Bioinformatics · 563 Zitationen · DOI
MOTIVATION: Text mining has become an important tool for biomedical research. The most fundamental text-mining task is the recognition of biomedical named entities (NER), such as genes, chemicals and diseases. Current NER methods rely on pre-defined features which try to capture the specific surface properties of entity types, properties of the typical local context, background knowledge, and linguistic information. State-of-the-art tools are entity-specific, as dictionaries and empirically optimal feature sets differ between entity types, which makes their development costly. Furthermore, features are often optimized for a specific gold standard corpus, which makes extrapolation of quality measures difficult. RESULTS: We show that a completely generic method based on deep learning and statistical word embeddings [called long short-term memory network-conditional random field (LSTM-CRF)] outperforms state-of-the-art entity-specific NER tools, and often by a large margin. To this end, we compared the performance of LSTM-CRF on 33 data sets covering five different entity classes with that of best-of-class NER tools and an entity-agnostic CRF implementation. On average, F1-score of LSTM-CRF is 5% above that of the baselines, mostly due to a sharp increase in recall. AVAILABILITY AND IMPLEMENTATION: The source code for LSTM-CRF is available at https://github.com/glample/tagger and the links to the corpora are available at https://corposaurus.github.io/corpora/ . CONTACT: habibima@informatik.hu-berlin.de.
Lecture notes in computer science · 498 Zitationen · DOI
The VLDB Journal · 431 Zitationen · DOI
Kooperationen20
Bestätigte Forscher↔Partner-Paare aus HU-FIS — Gold-Standard-Positive für das Matching.
Helmholtz-Einstein International Berlin Research School in Data Science (HEIBRiDS)
other
GRK 2424: Computermethoden für personalisierte Therapien in der Onkologie
other
SFB 1404/2: FONDA – Grundlagen von Workflows für die Analyse großer naturwissenschaftlicher Daten
other