Open Access archive

Indian Legal Corpus (ILC): A Dataset for A dataset summarizing Indian Legal Proceedings using Natural Language

Pawan Trivedi, PES University
Digha Jain, Symbiosis Institute of Technology
Shilpa Gite, Symbiosis Institute of Technology
Ketan Kotecha, Symbiosis International (Deemed University)

Document Type

Article

Publication Title

Engineered Science

Abstract

There is a significant backlog of legal proceedings in several large countries, including India. Technological advancements have been made in intelligent devices that can process and summarize legal documents. However, developing such data-driven systems requires a scarcity of high-quality corpora. Legal AI uses artificial intelligence technology, particularly Natural Language Processing (NLP), to help with legal duties. Legal professionals frequently consider how to solve problems using rule-and symbol-based methods, but NLP researchers are more interested in data-driven and embedding methods. So, in this paper, we present Indian Legal Corpus (ILC), a dataset for Indian legal document summarization. Our dataset differs from the existing summarization datasets in a way that our summaries are highly abstractive. This dataset offers new research opportunities for Legal documents with an abstractive approach. ILC is highly abstractive, concise, and of high quality, as indicated by human and intrinsic evaluation. We are releasing our dataset and models to encourage future research on Legal abstractive summarization.

DOI

10.30919/es1022

Publication Date

2-1-2024

Recommended Citation

Trivedi, Pawan; Jain, Digha; Gite, Shilpa; and Kotecha, Ketan, "Indian Legal Corpus (ILC): A Dataset for A dataset summarizing Indian Legal Proceedings using Natural Language" (2024). Open Access archive. 6894.
https://impressions.manipal.edu/open-access-archive/6894

This document is currently not available here.

COinS

Open Access archive

Indian Legal Corpus (ILC): A Dataset for A dataset summarizing Indian Legal Proceedings using Natural Language

Document Type

Publication Title

Abstract

DOI

Publication Date

Recommended Citation

Search

Browse

Author Corner

Open Access archive

Indian Legal Corpus (ILC): A Dataset for A dataset summarizing Indian Legal Proceedings using Natural Language

Authors

Document Type

Publication Title

Abstract

DOI

Publication Date

Recommended Citation

Share

Search

Browse

Author Corner