chaoss · officialasishkumar · Jun 16, 2025 · Jun 17, 2025 · Jun 17, 2025 · Jun 29, 2025
diff --git a/augur/application/db/models/__init__.py b/augur/application/db/models/__init__.py
@@ -65,6 +65,7 @@
     PullRequestReviewMessageRef,
     CommitMessage,
     RepoClone,
+    ContributorEngagement,
 )
 
 from augur.application.db.models.spdx import (

diff --git a/augur/application/db/models/augur_data.py b/augur/application/db/models/augur_data.py
@@ -3600,4 +3600,50 @@ class RepoClone(Base):
     count_clones = Column(BigInteger)
     clone_data_timestamp = Column(TIMESTAMP(precision=6))
 
-    repo = relationship("Repo")
+    repo = relationship("Repo")
+
+class ContributorEngagement(Base):
+    __tablename__ = "contributor_engagement"
+    __table_args__ = {"schema": "augur_data"}
+
+    engagement_id = Column(
+        BigInteger,
+        primary_key=True,
+        server_default=text(
+            "nextval('augur_data.contributor_engagement_engagement_id_seq'::regclass)"
+        ),
+    )
+    repo_id = Column(ForeignKey("augur_data.repo.repo_id"), nullable=False)
+    cntrb_id = Column(ForeignKey("augur_data.contributors.cntrb_id"), nullable=False)
+    username = Column(String, nullable=False)
+    full_name = Column(String)
+    country = Column(String)
+    platform = Column(String)
+
+    # D0 Level - Basic Engagement
+    d0_forked = Column(Boolean, server_default=text("false"))
+    d0_starred_or_watched = Column(Boolean, server_default=text("false"))
+    d0_engagement_timestamp = Column(TIMESTAMP(precision=6))
+
+    # D1 Level - Issue/Review Engagement
+    d1_first_issue_created_at = Column(TIMESTAMP(precision=6))
+    d1_first_pr_opened_at = Column(TIMESTAMP(precision=6))
+    d1_first_pr_commented_at = Column(TIMESTAMP(precision=6))
+
+    # D2 Level - Significant Contributions
+    d2_has_merged_pr = Column(Boolean, server_default=text("false"))
+    d2_created_many_issues = Column(Boolean, server_default=text("false"))
+    d2_total_comments = Column(BigInteger, server_default=text("0"))
+    d2_has_pr_with_many_commits = Column(Boolean, server_default=text("false"))
+    d2_commented_on_multiple_prs = Column(Boolean, server_default=text("false"))
+
+    # Metadata
+    tool_source = Column(String)
+    tool_version = Column(String)
+    data_source = Column(String)
+    data_collection_date = Column(
+        TIMESTAMP(precision=6), server_default=text("CURRENT_TIMESTAMP")
+    )
+
+    repo = relationship("Repo")
+    contributor = relationship("Contributor")
diff --git a/augur/application/schema/alembic/versions/35_add_contributor_engagement_table.py b/augur/application/schema/alembic/versions/35_add_contributor_engagement_table.py
@@ -0,0 +1,102 @@
+"""Add contributor_engagement table
+
+Revision ID: 35
+Revises: 33
+Create Date: 2025-07-26 10:00:00.000000
+
+"""
+
+import sqlalchemy as sa
+from alembic import op
+from sqlalchemy.dialects import postgresql
+
+# revision identifiers, used by Alembic.
+revision = "35"
+down_revision = "33"
+branch_labels = None
+depends_on = None
+
+
+def upgrade():
+    op.create_table(
+        "contributor_engagement",
+        sa.Column("engagement_id", sa.BigInteger(), autoincrement=True, nullable=False),
+        sa.Column("repo_id", sa.BigInteger(), nullable=False),
+        sa.Column("cntrb_id", postgresql.UUID(as_uuid=True), nullable=False),
+        sa.Column("username", sa.String(), nullable=False),
+        sa.Column("full_name", sa.String(), nullable=True),
+        sa.Column("country", sa.String(), nullable=True),
+        sa.Column("platform", sa.String(), nullable=True),
+        # D0 Level - Basic Engagement
+        sa.Column(
+            "d0_forked", sa.Boolean(), server_default=sa.text("false"), nullable=True
+        ),
+        sa.Column(
+            "d0_starred_or_watched",
+            sa.Boolean(),
+            server_default=sa.text("false"),
+            nullable=True,
+        ),
+        sa.Column("d0_engagement_timestamp", sa.TIMESTAMP, nullable=True),
+        # D1 Level - Issue/Review Engagement
+        sa.Column("d1_first_issue_created_at", sa.TIMESTAMP, nullable=True),
+        sa.Column("d1_first_pr_opened_at", sa.TIMESTAMP, nullable=True),
+        sa.Column("d1_first_pr_commented_at", sa.TIMESTAMP, nullable=True),
+        # D2 Level - Significant Contributions
+        sa.Column(
+            "d2_has_merged_pr",
+            sa.Boolean(),
+            server_default=sa.text("false"),
+            nullable=True,
+        ),
+        sa.Column(
+            "d2_created_many_issues",
+            sa.Boolean(),
+            server_default=sa.text("false"),
+            nullable=True,
+        ),
+        sa.Column(
+            "d2_total_comments",
+            sa.BigInteger(),
+            server_default=sa.text("0"),
+            nullable=True,
+        ),
+        sa.Column(
+            "d2_has_pr_with_many_commits",
+            sa.Boolean(),
+            server_default=sa.text("false"),
+            nullable=True,
+        ),
+        sa.Column(
+            "d2_commented_on_multiple_prs",
+            sa.Boolean(),
+            server_default=sa.text("false"),
+            nullable=True,
+        ),
+        # Metadata
+        sa.Column("tool_source", sa.String(), nullable=True),
+        sa.Column("tool_version", sa.String(), nullable=True),
+        sa.Column("data_source", sa.String(), nullable=True),
+        sa.Column(
+            "data_collection_date",
+            sa.TIMESTAMP,
+            server_default=sa.text("CURRENT_TIMESTAMP"),
+            nullable=True,
+        ),
+        sa.ForeignKeyConstraint(
+            ["repo_id"],
+            ["augur_data.repo.repo_id"],
+            name="fk_contributor_engagement_repo",
+        ),
+        sa.ForeignKeyConstraint(
+            ["cntrb_id"],
+            ["augur_data.contributors.cntrb_id"],
+            name="fk_contributor_engagement_contributors",
+        ),
+        sa.PrimaryKeyConstraint("engagement_id"),
+        schema="augur_data",
+    )
+
+
+def downgrade():
+    op.drop_table("contributor_engagement", schema="augur_data")
diff --git a/augur/tasks/contributors_engagement/__init__.py b/augur/tasks/contributors_engagement/__init__.py
@@ -0,0 +1,24 @@
+"""
+Contributor Engagement Tasks
+
+This module contains tasks for collecting and processing contributor engagement data
+at different levels (D0, D1, D2) as defined in the CHAOSS metrics.
+
+D0: Basic engagement (forks, stars/watches)
+D1: Issue/review engagement (first issue, first PR, first comment)
+D2: Significant contributions (merged PRs, many issues, multiple comments)
+"""
+
+from augur.tasks.contributors_engagement.worker import (
+    collect_contributor_engagement,
+    collect_d0_engagement,
+    collect_d1_engagement,
+    collect_d2_engagement
+)
+
+__all__ = [
+    'collect_contributor_engagement',
+    'collect_d0_engagement', 
+    'collect_d1_engagement',
+    'collect_d2_engagement'
+]