updates

BinaryOracle · BinaryOracle · commit 5c79de58954d · 2025-06-13T11:43:15.000+08:00
diff --git a/src/3DVL/LASO.md b/src/3DVL/LASO.md
@@ -675,6 +675,15 @@ _3daffordance = torch.sigmoid(_3daffordance)
 - 使用 sigmoid 得到最终的掩码，形状 `(B, N)`；
 - 每个点的值 ∈ [0, 1]，表示其属于目标功能区域的概率；
 
+## 损失函数
+
+### Focal Loss
+
+
+
+### Dice Loss
+
+
 ## 训练
 
 训练部分的核心代码实现如下:
@@ -813,7 +822,4 @@ def main(opt, dict):
 
     category_metrics, affordance_metrics, overall_metrics = evaluate(model, test_loader, device, 3)
     print_metrics_in_table(category_metrics, affordance_metrics, overall_metrics, logger)
-```
-
-### 损失函数
-
+```
diff --git a/src/other/语义分割中常用的损失函数.md b/src/other/语义分割中常用的损失函数.md
@@ -0,0 +1,100 @@
+---
+title: 分割任务中常用的损失函数
+icon: file
+category:
+  - tools
+tag:
+  - 已发布
+footer: 技术共建，知识共享
+date: 2025-06-11
+author:
+  - BinaryOracle
+---
+
+`分割任务中常用的损失函数` 
+
+<!-- more -->
+
+# 语义分割
+
+语义分割是计算机视觉领域中的一项任务，旨在将图像中的每个像素分类为不同的语义类别。与对象检测任务不同，语义分割不仅需要识别图像中的物体，还需要对每个像素进行分类，从而实现对图像的细粒度理解和分析。
+
+语义分割可以被看作是像素级别的图像分割，其目标是为图像中的每个像素分配一个特定的语义类别标签。每个像素都被视为图像的基本单位，因此语义分割可以提供更详细和准确的图像分析结果。
+
+***语义分割 vs 分类 :***
+
+1. 在语义分割任务中，由于需要对每个像素进行分类，因此需要使用像素级别的损失函数。
+
+2. 语义分割任务中，图像中各个类别的像素数量通常不均衡，例如背景像素可能占据了大部分。
+
+3. 语义分割任务需要对图像中的每个像素进行分类，同时保持空间连续性。
+
+# 损失函数
+
+## Dice Loss
+
+Dice Loss 是一种常用于语义分割任务的损失函数，尤其在目标区域较小、类别不平衡（class imbalance）的情况下表现优异。它来源于 Dice 系数（Dice Coefficient） ，又称为 Sørensen-Dice 系数 ，是衡量两个样本集合之间重叠程度的一种指标。
+
+Dice 系数衡量的是预测掩码与真实标签之间的相似性，公式如下：
+
+$$
+Dice = \frac{2|X \cap Y|}{|X| + |Y|}
+$$
+ 
+其中：
+
+- $X$ ：模型预测出的功能区域（如经过 sigmoid 后的概率值）；
+
+- $Y$ ：Ground Truth 掩码（二值化或软标签）；
+
+- $∣X∩Y∣$ ：预测为正类且实际也为正类的部分（交集）；
+
+- $∣X∣+∣Y∣$ ：预测和真实中所有正类区域之和；
+
+> ⚠️ 注意：Dice 系数范围是 [0, 1]，越大越好。 
+
+
+Dice Loss 为了将其作为损失函数使用，我们通常取其补集：
+
+$$
+Dice = 1−Dice
+$$
+
+有时也会加入一个平滑项 ϵ 防止除以零：
+
+$$
+L_{Dice} = 1 - \frac{2\sum(X \cdot Y) + \epsilon}{\sum X + \sum Y + \epsilon}
+$$
+
+Dice Loss 的优势:
+
+| 优势 | 描述 |
+| --- | --- |
+| 对类别不平衡不敏感,更关注“有没有覆盖正确区域”，而不是“有多少点被正确分类” | 不像 BCE Loss 那样对负样本过多敏感 |
+| 直接优化 IoU 的替代指标 | Dice 和 IoU 表现类似，但更易梯度下降 |
+| 支持 soft mask 输入 | 可处理连续概率值，不需要先 threshold |
+| 更关注整体区域匹配 | 而不是逐点分类 |
+
+
+
+代码实现:
+
+```python
+class DiceLoss(nn.Module):
+    def __init__(self, weight=None, size_average=True):
+        super(DiceLoss, self).__init__()
+
+    def forward(self, inputs, targets, smooth=1):
+        
+        #comment out if your model contains a sigmoid or equivalent activation layer
+        inputs = F.sigmoid(inputs)       
+        
+        #flatten label and prediction tensors
+        inputs = inputs.view(-1)
+        targets = targets.view(-1)
+        
+        intersection = (inputs * targets).sum()                            
+        dice = (2.*intersection + smooth)/(inputs.sum() + targets.sum() + smooth)  
+        
+        return 1 - dice
+```