Building and Exploring Web Corpora (WAC3 - 2007)

Proceedings of the 3rd web as corpus workshop, incorporating cleaneval
Première édition

Depuis plus de deux décennies, la question de l'islam occupe une place de choix dans le débat politique et médiatique français, notamment autour de la formation des cadres musulmans devenue une des préoccupations majeures des politiques publiques. Lire la suite

Ce livre explore les dynamiques complexes de la formation privée à l'islam dans l'hexagone. À travers l'analyse pluridisciplinaire des structures de formation, des contenus pédagogiques et des trajectoires des apprenants, les auteurs dévoilent les défis et les opportunités de cette offre exposée aux tensions sociétales et aux enjeux sécuritaires. L’ouvrage s’appuie sur des enquêtes de terrain menées de Lille à Marseille, en passant par Paris, Lyon ou encore Strasbourg. Dressant un état des lieux inédit de l’offre de formation à l’islam, l’étude inclut aussi bien des instituts physiques, des programmes en ligne, que des cercles d’études. Ce livre restitue les logiques socio-historiques sous-jacentes à l’émergence de ces structures et examine les relations entre les entrepreneurs pédagogiques et les synergies en oeuvre, offrant une typologie heuristique de la diversité des offres de formation en fonction de leurs objectifs, ancrages doctrinaux et formes organisationnelles. Il aborde les enjeux d’un marché de la formation islamique en France, marqué par l’action publique et les attentes sophistiquées des apprenants, ainsi que les stratégies d’implantation géographique et marketing déployées par les acteurs pour atteindre leurs publics-cibles. Il a été question d’analyser les modalités de certification, les contenus pédagogiques et les supports didactiques utilisés, tout en mettant en lumière les grandes tendances et les innovations didactiques au sein de l’offre de formation. Plus encore, le présent ouvrage questionne la possibilité de se former à l’islam, au xxie siècle, exclusivement par une offre francophone et permet de comprendre jusqu’où cette stratégie peut mener les apprenants.


Livre broché - 19,50 €
PDF - 8,99 €

InfoPour plus d'informations à propos de la TVA et d'autres moyens de paiement, consultez la rubrique "Paiement & TVA".

Spécifications


Éditeur
Presses universitaires Saint-Louis Bruxelles
Marque d'éditeur
Presses universitaires de Louvain
Partie du titre
Numéro 4
Édité par
Cédrick Fairon, Hubert Naets, Adam Kilgarriff, Gilles-Maurice de Schryver,
Collection
Cahiers du CENTAL | n° 4
Langue
anglais
BISAC Subject Heading
LAN009000 LANGUAGE ARTS & DISCIPLINES / Linguistics
Code publique Onix
06 Professionnel et académique
CLIL (Version 2013-2019 )
3147 Linguistique, Sciences du langage
Date de première publication du titre
01 octobre 2025
Type d'ouvrage
Monographie
Langue originale
anglais

Livre broché


Date de publication
01 janvier 2007
ISBN-13
9782874630828
Ampleur
Nombre de pages de contenu principal : 182
Code interne
76399
Format
16 x 24 x 1 cm
Poids
510 grams
Prix
19,70 €
ONIX XML
Version 2.1, Version 3

PDF


Date de publication
01 janvier 2007
ISBN-13
9782874635045
Ampleur
Nombre de pages de contenu principal : 182
Code interne
76399PDF
ONIX XML
Version 2.1, Version 3

Google Livres Aperçu


Publier un commentaire sur cet ouvrage

Sommaire


Table of Contents .................................................................................................... vii

Preface ..................................................................................................................... 1

WAC3 ..................................................................................................................... 3

Kevin P. SCANNELL, The Crúbadán Project: Corpus building for underresourced

languages ..........................................................................................5

Sebastian BLOHM, Philipp CIMIANO, A Human Evaluation of Filtering

Functions for Pattern-based Extraction of Arbitrary Relations from the

Web .....................................................................................................................17

Emmanuel CARTIER, TextBox, a Written Corpus Tool for Linguistic Analysis ...... 33

William H. FLETCHER, Implementing a BNC-Compare-able Web Corpus ............ 43

Fabrice ISSAC, Yet Another Web Crawler ................................................................ 57

Igor LETURIA, Antton GURRUTXAGA, Iñaki ALEGRIA, Aitzol EZEIZA, CorpEus,

a 'web as corpus' tool designed for the agglutinative nature of Basque ...........69

Serge SHAROFF, Classifying Web corpora into domain and genre using

automatic feature identification .........................................................................83

Anil Kumar SINGH, Jagadeesh GORLA, Identification of Languages and

Encodings in a Multilingual Document ............................................................. 95

CLEANEVAL .......................................................................................................... 109

Daniel BAUER, Judith DEGEN, Xiaoye DENG, Priska HERGER, Jan GASTHAUS,

Eugenie GIESBRECHT, Lina JANSEN, Christin KALINA, Thorben KRÜGER,

Robert MÄRTIN, Martin SCHMIDT, Simon SCHOLLER, Johannes STEGER,

Egon STEMLE, Stefan EVERT, FIASCO: Filtering the Internet by Automatic

Subtree Classification, Osnabrück ..................................................................... 111

Stefan EVERT, StupidOS: A high-precision approach to boilerplate removal ........ 123

Weizheng GAO, Tony ABOU-ASSALEH, GenieKnows Web Page Cleaning

System ................................................................................................................. 135

Christian GIRARDI, Htmcleaner: Extracting the Relevant Text from the Web Pages ..... 141

Katja HOFMANN, Wouter WEERKAMP, Web Corpus Cleaning using Content

and Structure ...................................................................................................... 145

Michal MAREK, Pavel PECINA, Miroslav SPOUSTA, Web Page Cleaning with

Conditional Random Fields ............................................................................... 155

Xabier SARALEGI, Igor LETURIA, Kimatu, a tool for cleaning non-content text

parts from HTML docs ....................................................................................... 163