atomind-ai
diff --git a/‎examples/eos_bulk/CHGNet_processed.parquet‎
Lines changed: 2 additions & 2 deletions b/‎examples/eos_bulk/CHGNet_processed.parquet‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎examples/eos_bulk/M3GNet_processed.parquet‎
Lines changed: 2 additions & 2 deletions b/‎examples/eos_bulk/M3GNet_processed.parquet‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎examples/eos_bulk/MACE-MP(M)_processed.parquet‎
Lines changed: 2 additions & 2 deletions b/‎examples/eos_bulk/MACE-MP(M)_processed.parquet‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎examples/eos_bulk/MACE-MPA_processed.parquet‎
Lines changed: 2 additions & 2 deletions b/‎examples/eos_bulk/MACE-MPA_processed.parquet‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎examples/eos_bulk/MatterSim_processed.parquet‎
Lines changed: 2 additions & 2 deletions b/‎examples/eos_bulk/MatterSim_processed.parquet‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎examples/eos_bulk/ORBv2_processed.parquet‎
Lines changed: 2 additions & 2 deletions b/‎examples/eos_bulk/ORBv2_processed.parquet‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎examples/eos_bulk/SevenNet_processed.parquet‎
Lines changed: 2 additions & 2 deletions b/‎examples/eos_bulk/SevenNet_processed.parquet‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎examples/eos_bulk/analyze.py‎
Lines changed: 216 additions & 0 deletions b/‎examples/eos_bulk/analyze.py‎
Lines changed: 216 additions & 0 deletions
diff --git a/‎examples/eos_bulk/eSEN_processed.parquet‎
Lines changed: 2 additions & 2 deletions b/‎examples/eos_bulk/eSEN_processed.parquet‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎examples/eos_bulk/eos-bulk-grid.pdf‎
888 KB b/‎examples/eos_bulk/eos-bulk-grid.pdf‎
888 KB
@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0416eeed1748994b67e8f6e9768a5f1d2a77c19f9512bc408f9b39ca3c19e3d4
-size 358042
+oid sha256:bfde7530e6b0d2df5a30e1b7e3ec124fb2a86f6da8e35d2548d37d10a1eff1b1
+size 387425
@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1a34f8148f771f0b751f01ccc9d260fd5ae48b625b979ec2112e008c82c59a08
-size 379982
+oid sha256:eb43a3c74f3340100b1adb21b3f2d075451e1ffe88ac6d6662741bc4a0576eb8
+size 397450
@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:73e2b8ad6d5e114c1c0fea4697b17810182d0b273185512cb40fa894ea30b4c3
-size 371128
+oid sha256:7e5507cdc5fe558b5d3fe2ea8f1dd577ac444e82c5347b5fbe738a4f855dffcb
+size 397379
@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:819bc0c721e99df8dda0a4c6df565deb96736ecc5ceefefe300e5b72b7d6312f
-size 365412
+oid sha256:0f3032d5a156febdd9580fa3d86cb1a84236374bcac6ccb22d18a948767db502
+size 394748
@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c707ffb285f03a5c7d1486a6998c787088f07a97b206585b17839fff4fab49b4
-size 321086
+oid sha256:fb1f10a60495f5e88ea8cf737fd7b47d1c471fda422374ee519d14f531c732f8
+size 290191
@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f794da83d1031823577b085c480f7d285520c086bdd0e7e6e7acb7a5a2457329
-size 228052
+oid sha256:7eb0a3060b8a2d3541b8fb1083176c88aae0a8be0008e84d5770998b01742216
+size 402554
@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a9aab95402aa62169ba6f1e12a7774362b3e5cc027f5c556de734783e6d6f29b
-size 364969
+oid sha256:9f484928f5086e8d1411a198ac69bfe44313597909b72c8676e9131cce1660f1
+size 398295
@@ -0,0 +1,216 @@
+from pathlib import Path
+
+import numpy as np
+import pandas as pd
+from ase.db import connect
+from scipy import stats
+
+from mlip_arena.models import REGISTRY, MLIPEnum
+
+DATA_DIR = Path(__file__).parent.absolute()
+
+
+def load_wbm_structures():
+    """
+    Load the WBM structures from a ASE DB file.
+    """
+    with connect(DATA_DIR.parent / "wbm_structures.db") as db:
+        for row in db.select():
+            yield row.toatoms(add_additional_information=True)
+
+def gather_results():
+    for model in MLIPEnum:
+        if "eos_bulk" not in REGISTRY[model.name].get("gpu-tasks", []):
+            continue
+
+        if (DATA_DIR / f"{model.name}.parquet").exists():
+            continue
+
+        all_data = []
+
+        for atoms in load_wbm_structures():
+            fpath = Path(model.name) / f"{atoms.info['key_value_pairs']['wbm_id']}.pkl"
+            if not fpath.exists():
+                continue
+
+            all_data.append(pd.read_pickle(fpath))
+
+        df = pd.concat(all_data, ignore_index=True)
+        df.to_parquet(DATA_DIR / f"{model.name}.parquet")
+
+
+def summarize():
+    summary_table = pd.DataFrame(
+        columns=[
+            "model",
+            "energy-diff-flip-times",
+            "tortuosity",
+            "spearman-compression-energy",
+            "spearman-compression-derivative",
+            "spearman-tension-energy",
+            "missing",
+        ]
+    )
+
+
+    for model in MLIPEnum:
+        fpath = DATA_DIR / f"{model.name}.parquet"
+        if not fpath.exists():
+            continue
+        df_raw_results = pd.read_parquet(fpath)
+
+        df_analyzed = pd.DataFrame(
+            columns=[
+                "model",
+                "structure",
+                "formula",
+                "volume-ratio",
+                "energy-delta-per-atom",
+                "energy-diff-flip-times",
+                "energy-delta-per-volume-b0",
+                "tortuosity",
+                "spearman-compression-energy",
+                "spearman-compression-derivative",
+                "spearman-tension-energy",
+                "missing",
+            ]
+        )
+
+        for wbm_struct in load_wbm_structures():
+            structure_id = wbm_struct.info["key_value_pairs"]["wbm_id"]
+
+            try:
+                results = df_raw_results.loc[df_raw_results["id"] == structure_id]
+                b0 = results["b0"].values[0]
+                # vol0 = results["v0"].values[0]
+                results = results["eos"].values[0]
+                es = np.array(results["energies"])
+                vols = np.array(results["volumes"])
+
+                indices = np.argsort(vols)
+                vols = vols[indices]
+                es = es[indices]
+
+                imine = len(es) // 2
+                # min_center_val = np.min(es[imid - 1 : imid + 2])
+                # imine = np.where(es == min_center_val)[0][0]
+                emin = es[imine]
+                vol0 = vols[imine]
+
+                interpolated_volumes = [
+                    (vols[i] + vols[i + 1]) / 2 for i in range(len(vols) - 1)
+                ]
+                ediff = np.diff(es)
+                ediff_sign = np.sign(ediff)
+                mask = ediff_sign != 0
+                ediff = ediff[mask]
+                ediff_sign = ediff_sign[mask]
+                ediff_flip = np.diff(ediff_sign) != 0
+
+                etv = np.sum(np.abs(np.diff(es)))
+
+                data = {
+                    "model": model.name,
+                    "structure": structure_id,
+                    "formula": wbm_struct.get_chemical_formula(),
+                    "missing": False,
+                    "volume-ratio": vols / vol0,
+                    "energy-delta-per-atom": (es - emin) / len(wbm_struct),
+                    "energy-diff-flip-times": np.sum(ediff_flip).astype(int),
+                    "energy-delta-per-volume-b0": (es - emin) / (b0*vol0),
+                    "tortuosity": etv / (abs(es[0] - emin) + abs(es[-1] - emin)),
+                    "spearman-compression-energy": stats.spearmanr(
+                        vols[:imine], es[:imine]
+                    ).statistic,
+                    "spearman-compression-derivative": stats.spearmanr(
+                        interpolated_volumes[:imine], ediff[:imine]
+                    ).statistic,
+                    "spearman-tension-energy": stats.spearmanr(
+                        vols[imine:], es[imine:]
+                    ).statistic,
+                }
+
+            except Exception as e:
+                print(e)
+                data = {
+                    "model": model.name,
+                    "structure": structure_id,
+                    "formula": wbm_struct.get_chemical_formula(),
+                    "missing": True,
+                    "volume-ratio": None,
+                    "energy-delta-per-atom": None,
+                    "energy-delta-per-volume-b0": None,
+                    "energy-diff-flip-times": None,
+                    "tortuosity": None,
+                    "spearman-compression-energy": None,
+                    "spearman-compression-derivative": None,
+                    "spearman-tension-energy": None,
+                }
+
+            df_analyzed = pd.concat([df_analyzed, pd.DataFrame([data])], ignore_index=True)
+
+        df_analyzed.to_parquet(DATA_DIR / f"{model.name}_processed.parquet")
+        # json_fpath = DATA_DIR / f"EV_scan_analyzed_{model.name}.json"
+
+        # df_analyzed.to_json(json_fpath, orient="records")
+
+        valid_results = df_analyzed[df_analyzed["missing"] == False]
+
+        analysis_summary = {
+            "model": model.name,
+            "energy-diff-flip-times": valid_results["energy-diff-flip-times"].mean(),
+            "tortuosity": valid_results["tortuosity"].mean(),
+            "spearman-compression-energy": valid_results[
+                "spearman-compression-energy"
+            ].mean(),
+            "spearman-compression-derivative": valid_results[
+                "spearman-compression-derivative"
+            ].mean(),
+            "spearman-tension-energy": valid_results["spearman-tension-energy"].mean(),
+            "missing": len(df_analyzed[df_analyzed["missing"] == True]),
+        }
+        summary_table = pd.concat(
+            [summary_table, pd.DataFrame([analysis_summary])], ignore_index=True
+        )
+
+
+    flip_rank = (
+        (summary_table["energy-diff-flip-times"] - 1)
+        .abs()
+        .rank(ascending=True, method="min")
+    )
+    tortuosity_rank = summary_table["tortuosity"].rank(ascending=True, method="min")
+    spearman_compression_energy_rank = summary_table["spearman-compression-energy"].rank(
+        method="min"
+    )
+    spearman_compression_derivative_rank = summary_table[
+        "spearman-compression-derivative"
+    ].rank(ascending=False, method="min")
+    spearman_tension_energy_rank = summary_table["spearman-tension-energy"].rank(
+        ascending=False, method="min"
+    )
+    missing_rank = summary_table["missing"].rank(ascending=True, method="min")
+
+    rank_aggr = (
+        flip_rank
+        + tortuosity_rank
+        + spearman_compression_energy_rank
+        + spearman_compression_derivative_rank
+        + spearman_tension_energy_rank
+        + missing_rank
+    )
+    rank = rank_aggr.rank(method="min")
+
+    summary_table.insert(1, "rank", rank.astype(int))
+    summary_table.insert(2, "rank-aggregation", rank_aggr.astype(int))
+    summary_table = summary_table.sort_values(by="rank", ascending=True)
+    summary_table = summary_table.reset_index(drop=True)
+
+    summary_table.to_csv(DATA_DIR / "summary.csv", index=False)
+    summary_table.to_latex(DATA_DIR / "summary.tex", index=False)
+
+    return summary_table
+
+if __name__ == "__main__":
+    gather_results()
+    summarize()
@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3d12b36a2bd465e16ada4363e31756d5de5d41dd890d0e88e8ca86b76dd66336
-size 313235
+oid sha256:d7f754d8e18f645c1608e86286245c11611d5af34f3bd0bbc4a5b63b851a0dee
+size 393790