scikit-learn-contrib · mathurinm · Dec 9, 2022 · Nov 30, 2022 · Nov 30, 2022 · Dec 1, 2022
diff --git a/skglm/experimental/quantile_regression.py b/skglm/experimental/quantile_regression.py
@@ -0,0 +1,73 @@
+import numpy as np
+from numba import float64
+from skglm.datafits import BaseDatafit
+from skglm.utils.prox_funcs import ST_vec
+
+
+class Pinball(BaseDatafit):
+ r"""Pinball datafit.
+
+ The datafit reads::
+
+ quantile * max(y - Xw, 0) + (1 - quantile) * max(Xw - y, 0)
+
+ with ``quantile`` in [0, 1].
+
+ Parameters
+ ----------
+ quantile : float
+ Quantile must be in [0, 1]. When ``quantile=0.5``,
+ the datafit becomes a Least Absolute Deviation (LAD) datafit.
+ """
+
+ def __init__(self, quantile):
+ self.quantile = quantile
+
+ def value(self, y, w, Xw):
+ # implementation taken from
+ # github.com/benchopt/benchmark_quantile_regression/blob/main/objective.py
+ quantile = self.quantile
+
+ residual = y - Xw
+ sign = residual >= 0
+
+ loss = quantile * sign * residual - (1 - quantile) * (1 - sign) * residual
+ return np.sum(loss)
+
+ def prox(self, w, step, y):
+ """Prox of ``step * ||y - . ||``."""
+ shift_cst = (self.quantile - 1/2) * step
+ return y - ST_vec(y - w - shift_cst, step / 2)
+
+ def prox_conjugate(self, z, step, y):
+ """Prox of ``step * ||y - . ||^*``."""
+ # using Moreau decomposition
+ inv_step = 1 / step
+ return z - step * self.prox(inv_step * z, inv_step, y)
+
+ def subdiff_distance(self, Xw, z, y):
+ """Distance of ``z`` to subdiff of ||y - . ||_1 at ``Xw``."""
+ # computation note: \partial ||y - . ||_1(Xw) = -\partial || . ||_1(y - Xw)
+ y_minus_Xw = y - Xw
+ shift_cst = self.quantile - 1/2
+
+ max_distance = 0.
+ for i in range(len(y)):
+
+ if y_minus_Xw[i] == 0.:
+ distance_i = max(0, abs(z[i] - shift_cst) - 1)
+ else:
+ distance_i = abs(z[i] + shift_cst + np.sign(y_minus_Xw[i]))
+
+ max_distance = max(max_distance, distance_i)
+
+ return max_distance
+
+ def get_spec(self):
+ spec = (
+ ('quantile', float64),
+ )
+ return spec
+
+ def params_to_dict(self):
+ return dict(quantile=self.quantile)
diff --git a/skglm/experimental/tests/test_quantile_regression.py b/skglm/experimental/tests/test_quantile_regression.py
@@ -0,0 +1,38 @@
+import pytest
+import numpy as np
+from numpy.linalg import norm
+
+from skglm.penalties import L1
+from skglm.experimental.pdcd_ws import PDCD_WS
+from skglm.experimental.quantile_regression import Pinball
+
+from skglm.utils.data import make_correlated_data
+from sklearn.linear_model import QuantileRegressor
+
+
+@pytest.mark.parametrize('quantile', [0.3, 0.5, 0.7])
+def test_PDCD_WS(quantile):
+ n_samples, n_features = 50, 10
+ X, y, _ = make_correlated_data(n_samples, n_features, random_state=123)
+
+ # optimality condition for w = 0.
+ # for all g in subdiff pinball(y), g must be in subdiff ||.||_1(0)
+ # hint: use max(x, 0) = (x + |x|) / 2 to get subdiff pinball
+ alpha_max = norm(X.T @ (np.sign(y)/2 + (quantile - 0.5)), ord=np.inf)
+ alpha = alpha_max / 5
+
+ w = PDCD_WS(
+ dual_init=np.sign(y)/2 + (quantile - 0.5)
+ ).solve(X, y, Pinball(quantile), L1(alpha))[0]
+
+ clf = QuantileRegressor(
+ quantile=quantile,
+ alpha=alpha/n_samples,
+ fit_intercept=False
+ ).fit(X, y)
+
+ np.testing.assert_allclose(w, clf.coef_, atol=1e-5)
+
+
+if __name__ == '__main__':
+ pass