<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>xxfe.com</title>
    <link>https://xxfe.com/</link>
    <description>Recent content on xxfe.com</description>
    <generator>Hugo</generator>
    <language>zh-cn</language>
    <lastBuildDate>Tue, 17 Dec 2024 00:00:00 +0800</lastBuildDate>
    <atom:link href="https://xxfe.com/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>从坑中爬起：ESXi 8.0直通NVIDIA显卡的血泪经验</title>
      <link>https://xxfe.com/posts/20241217-esxi-many-fixes/</link>
      <pubDate>Tue, 17 Dec 2024 00:00:00 +0800</pubDate>
      <guid>https://xxfe.com/posts/20241217-esxi-many-fixes/</guid>
      <description>&lt;p&gt;    在虚拟化技术迅猛发展的今天，利用虚拟机高效管理和分配硬件资源已成为技术人员日常工作的重要组成部分。然而，当涉及到需要高性能图形处理的任务，如深度学习、3D建模或游戏服务器时，如何在虚拟机中实现NVIDIA显卡的直通（GPU Passthrough）成为一大挑战。本文将详细分享我在使用ESXi 8.0进行NVIDIA显卡直通过程中的各种坑与经验，帮助大家少走弯路，顺利实现高效的硬件利用。&lt;/p&gt;&#xA;&lt;p&gt;    要顺利实现NVIDIA显卡的直通，首先需要具备合适的硬件环境。我配置的主板是华硕 B760i，CPU是14600KF。&#xA;华硕 B760i 主板支持最新的IOMMU技术（Intel VT-d），这对于GPU直通至关重要。搭配强劲的i5处理器，不仅能够提供充足的计算性能，还支持多线程和高频率运行，为虚拟化环境提供了坚实的基础。&lt;/p&gt;</description>
    </item>
    <item>
      <title>EBPF原子操作避坑指南</title>
      <link>https://xxfe.com/posts/20231031-ebpf-atomic/</link>
      <pubDate>Tue, 31 Oct 2023 22:13:51 +0800</pubDate>
      <guid>https://xxfe.com/posts/20231031-ebpf-atomic/</guid>
      <description>&lt;p&gt;好久没更新了，有点惭愧。且最近在EBPF的原子性上也头疼了将近一周的时间，主要是通过测试不同的原子性方法，来兼容不同的环境。&lt;/p&gt;&#xA;&lt;p&gt;这次将测试验证的过程记录下来，以避免以后踩到同样类型的坑里。&lt;/p&gt;</description>
    </item>
    <item>
      <title>EBPF 随笔</title>
      <link>https://xxfe.com/posts/20230724-ebpf-essay/</link>
      <pubDate>Mon, 24 Jul 2023 14:22:52 +0800</pubDate>
      <guid>https://xxfe.com/posts/20230724-ebpf-essay/</guid>
      <description>&lt;p&gt;记录关于EBPF的随笔，以Linux-5.10版本的内核为基准。&lt;/p&gt;</description>
    </item>
    <item>
      <title>在WSL2上支持EBPF环境</title>
      <link>https://xxfe.com/posts/20230503-ebpf-on-wsl2/</link>
      <pubDate>Wed, 03 May 2023 19:53:35 +0800</pubDate>
      <guid>https://xxfe.com/posts/20230503-ebpf-on-wsl2/</guid>
      <description>&lt;p&gt;五一假期，闲里偷闲，在Windows电脑上将EBPF环境在WSL2上调试成功了，这里记录下调试过程，以待后续查阅。&lt;/p&gt;</description>
    </item>
    <item>
      <title>在M1芯片上使用Qemu安装Ubuntu</title>
      <link>https://xxfe.com/posts/20230403-qemu-ubuntu/</link>
      <pubDate>Mon, 03 Apr 2023 15:43:27 +0800</pubDate>
      <guid>https://xxfe.com/posts/20230403-qemu-ubuntu/</guid>
      <description>&lt;p&gt;这里介绍一下在 MacOS M1 Chip 的设备上，如何使用qemu 运行ubuntu；不论是基于学习还是测试的目的，这篇文章都会很有用。&lt;/p&gt;</description>
    </item>
    <item>
      <title>并行计算-实现&#34;前缀和&#34;算法</title>
      <link>https://xxfe.com/posts/20230327-cuda-prefix-sum/</link>
      <pubDate>Mon, 27 Mar 2023 09:27:30 +0800</pubDate>
      <guid>https://xxfe.com/posts/20230327-cuda-prefix-sum/</guid>
      <description>&lt;blockquote&gt;&#xA;&lt;p&gt;最近惊喜发现刚买的笔记本电脑自带了一块RTX2050显卡，带2048个CUDA核心。那么研究一下并行计算，让这块显卡也发挥一下价值。&lt;/p&gt;&#xA;&lt;/blockquote&gt;</description>
    </item>
    <item>
      <title>利用CloudFlare的Worker反代Github站点</title>
      <link>https://xxfe.com/posts/20230317-reverse-proxy-to-github/</link>
      <pubDate>Fri, 17 Mar 2023 12:55:54 +0800</pubDate>
      <guid>https://xxfe.com/posts/20230317-reverse-proxy-to-github/</guid>
      <description>&lt;p&gt;由于最近Github.com站点经常有Timeout或Reset的情况发生，所以想零成本的做一个Github的代理。&lt;/p&gt;&#xA;&lt;p&gt;这里使用CloudFlare的免费Worker功能，对Github做全球代理。同时Cloudflare会对静态页面做CDN缓存，也会加快我们访问github的速度。&lt;/p&gt;&#xA;&lt;p&gt;很少的几行代码，解决了很大的事情。&lt;/p&gt;</description>
    </item>
    <item>
      <title>在X86设备上构建多CPU架构的容器</title>
      <link>https://xxfe.com/posts/20230215-docker-build-multiarch/</link>
      <pubDate>Wed, 15 Feb 2023 17:03:51 +0800</pubDate>
      <guid>https://xxfe.com/posts/20230215-docker-build-multiarch/</guid>
      <description>&lt;p&gt;构建支持不同CPU架构的容器镜像，是个比较棘手的事情。&lt;/p&gt;&#xA;&lt;p&gt;docker官方提供了一个基于CLI的插件buildx提供构建的扩展能力，可以在x86或arm64的设备上构建支持多CPU架构的容器镜像。&lt;/p&gt;</description>
    </item>
    <item>
      <title>躺不平&amp;卷不赢：春节期间手撕WebRDP</title>
      <link>https://xxfe.com/posts/20230126-webrdp/</link>
      <pubDate>Thu, 26 Jan 2023 11:03:24 +0800</pubDate>
      <guid>https://xxfe.com/posts/20230126-webrdp/</guid>
      <description>&lt;p&gt;兔年的春节期间，没有躺平，可能也没卷赢。&lt;/p&gt;&#xA;&lt;p&gt;挤了些时间，通过查阅资料，手撕了一个WebRDP程序，将Windows远程桌面搬到了Web端。&lt;/p&gt;</description>
    </item>
    <item>
      <title>Contact</title>
      <link>https://xxfe.com/home/03-contact/</link>
      <pubDate>Tue, 17 Jan 2023 21:26:30 +0800</pubDate>
      <guid>https://xxfe.com/home/03-contact/</guid>
      <description>&lt;section class=&#34;home-section &#34; id=&#34;contact&#34;&gt;&#xA;    &#xA;&#xA;&#xA;&#xA;&#xA;&#xA;&lt;div id=&#34;8c2f778018b5976f&#34; class=&#34;home-block&#34;&gt;&#xA;    &#xA;    &#xA;&lt;p class=&#34;section-label&#34;&gt;Contact&lt;/p&gt;&#xA;&lt;h2 id=&#34;contact-title&#34;&gt;联系我&lt;/h2&gt;&#xA;&lt;p class=&#34;contact-intro&#34;&gt;如果你想交流安全研发、基础设施实践，或者只是对某篇文章有反馈，可以直接通过下面的方式联系我。&lt;/p&gt;&#xA;&#xA;&lt;div class=&#34;contact-layout&#34;&gt;&#xA;    &lt;div class=&#34;contact-card&#34;&gt;&#xA;        &lt;h3&gt;联系信息&lt;/h3&gt;&#xA;        &lt;div class=&#34;contact-row&#34;&gt;&#xA;            &#xA;            &#xA;            &lt;i  class=&#34;bx bx-map&#34;&gt;&lt;/i&gt; &#xA;            &lt;div&gt;&#xA;                &lt;strong&gt;地址&lt;/strong&gt;&#xA;                &lt;span&gt;北京市大兴区&lt;/span&gt;&#xA;            &lt;/div&gt;&#xA;        &lt;/div&gt;&#xA;        &lt;div class=&#34;contact-row&#34;&gt;&#xA;            &#xA;            &#xA;            &lt;i  class=&#34;bx bx-envelope&#34;&gt;&lt;/i&gt; &#xA;            &lt;div&gt;&#xA;                &lt;strong&gt;邮箱&lt;/strong&gt;&#xA;                &lt;a href=&#34;mailto:terry.an.bj@gmail.com&#34;&gt;terry.an.bj@gmail.com&lt;/a&gt;&#xA;            &lt;/div&gt;&#xA;        &lt;/div&gt;&#xA;    &lt;/div&gt;&#xA;&#xA;    &lt;div class=&#34;contact-card&#34;&gt;&#xA;        &lt;h3&gt;公众号&lt;/h3&gt;&#xA;        &lt;div class=&#34;contact-qr-wrap&#34;&gt;&#xA;            &#xA;            &#xA;            &#xA;            &#xA;            &#xA;            &#xA;            &#xA;            &#xA;            &#xA;            &#xA;            &#xA;            &#xA;            &#xA;            &#xA;            &#xA;            &#xA;            &lt;figure class=&#34;align-center contact-qr&#34;&gt;&#xA;                &lt;img&#xA;                    src=&#34;https://xxfe.com/images/qrcode.jpg&#34;&#xA;                    data-full-src=&#34;https://xxfe.com/images/qrcode.jpg&#34;&#xA;                    &#xA;                    width=&#34;258&#34; height=&#34;258&#34;&#xA;                    alt=&#34;公众号二维码&#34;&#xA;                    loading=&#34;lazy&#34;&#xA;                    decoding=&#34;async&#34;&#xA;                    style=&#34;width:100%; max-width:220px; height:auto;&#34; /&gt;&#xA;                &lt;figcaption&gt;&lt;/figcaption&gt;&#xA;            &lt;/figure&gt;&#xA;&#xA;        &lt;/div&gt;&#xA;    &lt;/div&gt;&#xA;&lt;/div&gt;&#xA;&#xA;&lt;/div&gt;&#xA;&#xA;&lt;/section&gt;</description>
    </item>
    <item>
      <title>监控Linux文件被进程篡改</title>
      <link>https://xxfe.com/posts/20230106-audit-linux-file-change/</link>
      <pubDate>Fri, 06 Jan 2023 10:38:20 +0800</pubDate>
      <guid>https://xxfe.com/posts/20230106-audit-linux-file-change/</guid>
      <description>&lt;p&gt;最近有一台隔离环境的设备，sshd_config文件总是被修改，造成登录时间超过30秒。&lt;/p&gt;&#xA;&lt;p&gt;这里介绍使用audit监控该文件被修改的事件。&lt;/p&gt;</description>
    </item>
    <item>
      <title>安装原生Kubernetes单机/集群版</title>
      <link>https://xxfe.com/posts/20221230-quick-install-kubernetes/</link>
      <pubDate>Fri, 30 Dec 2022 14:09:00 +0800</pubDate>
      <guid>https://xxfe.com/posts/20221230-quick-install-kubernetes/</guid>
      <description>&lt;p&gt;这里介绍安装原生Kubernetes单机/集群版的方法，非Minikube、非Kind、非Colima等指令； 使用的是原生kubelet、kubeadm来部署Kubernetes。&lt;/p&gt;&#xA;&lt;p&gt;kubeadm是Kubernetes官方提供的快速安装集群的工具，伴随着Kubernetes的版本发布进行更新。&lt;/p&gt;</description>
    </item>
    <item>
      <title>My First Post</title>
      <link>https://xxfe.com/posts/20221226-my-first-post/</link>
      <pubDate>Mon, 26 Dec 2022 20:27:26 +0800</pubDate>
      <guid>https://xxfe.com/posts/20221226-my-first-post/</guid>
      <description>&lt;p&gt;This is my first Post.&lt;/p&gt;</description>
    </item>
    <item>
      <title>About</title>
      <link>https://xxfe.com/home/02-about/</link>
      <pubDate>Sun, 25 Dec 2022 13:06:57 +0800</pubDate>
      <guid>https://xxfe.com/home/02-about/</guid>
      <description>&lt;section class=&#34;home-section home-about-section&#34; id=&#34;about&#34;&gt;&#xA;    &#xA;&#xA;&#xA;&#xA;&#xA;&#xA;&lt;div id=&#34;ef24c6ec7b2ef5ab&#34; class=&#34;home-block about-copy&#34;&gt;&#xA;    &#xA;    &#xA;&lt;p class=&#34;section-label&#34;&gt;About&lt;/p&gt;&#xA;&lt;h2 id=&#34;about-title&#34;&gt;关于我&lt;/h2&gt;&#xA;&lt;p class=&#34;about-summary&#34;&gt;&#xA;本人安宏奎，笔名君自强，拥有约 20 年工程经验。当前主要负责 AI Infra 方向的基础设施建设，&#xA;围绕超大规模 GPU 集群推进调度、资源管理、可视化与平台化能力落地，也长期参与服务端架构与基础设施工程体系建设。&#xA;&lt;/p&gt;&#xA;&#xA;&lt;div class=&#34;about-focus&#34;&gt;&#xA;    &lt;div class=&#34;about-focus-item&#34;&gt;&#xA;        &lt;strong&gt;当前重点&lt;/strong&gt;&#xA;        &lt;span&gt;AI Infra 基础设施&lt;/span&gt;&#xA;    &lt;/div&gt;&#xA;    &lt;div class=&#34;about-focus-item&#34;&gt;&#xA;        &lt;strong&gt;规模经验&lt;/strong&gt;&#xA;        &lt;span&gt;10 万卡集群建设&lt;/span&gt;&#xA;    &lt;/div&gt;&#xA;    &lt;div class=&#34;about-focus-item&#34;&gt;&#xA;        &lt;strong&gt;职责范围&lt;/strong&gt;&#xA;        &lt;span&gt;调度、资源管理、可视化&lt;/span&gt;&#xA;    &lt;/div&gt;&#xA;&lt;/div&gt;&#xA;&#xA;&lt;div class=&#34;about-grid&#34;&gt;&#xA;    &lt;div class=&#34;about-point&#34;&gt;&#xA;        &lt;strong&gt;集群建设&lt;/strong&gt;&#xA;        &lt;span&gt;参与 10 万卡级别集群建设，关注从资源接入、容量规划到稳定交付的整体链路。&lt;/span&gt;&#xA;    &lt;/div&gt;&#xA;    &lt;div class=&#34;about-point&#34;&gt;&#xA;        &lt;strong&gt;调度体系&lt;/strong&gt;&#xA;        &lt;span&gt;持续优化训练任务调度策略，处理资源碎片、优先级、公平性和大规模任务编排问题。&lt;/span&gt;&#xA;    &lt;/div&gt;&#xA;    &lt;div class=&#34;about-point&#34;&gt;&#xA;        &lt;strong&gt;资源管理&lt;/strong&gt;&#xA;        &lt;span&gt;负责资源池、配额、容量规划和利用率治理，让算力供给、分配和回收都可管可控。&lt;/span&gt;&#xA;    &lt;/div&gt;&#xA;    &lt;div class=&#34;about-point&#34;&gt;&#xA;        &lt;strong&gt;可视化平台&lt;/strong&gt;&#xA;        &lt;span&gt;推动集群状态、任务运行与运营数据可视化，支撑运维、研发和管理侧高效协同。&lt;/span&gt;&#xA;    &lt;/div&gt;&#xA;&lt;/div&gt;&#xA;&#xA;&lt;p class=&#34;about-quote&#34;&gt;我更关注的是把复杂算力基础设施做成真正可交付、可运营、可持续演进的工程系统。&lt;/p&gt;&#xA;&#xA;&lt;/div&gt;&#xA;&#xA;&#xA;&#xA;&#xA;&#xA;&#xA;&lt;div id=&#34;899ba35d30d0be67&#34; class=&#34;home-block about-media&#34;&gt;&#xA;    &#xA;    &#xA;&lt;div class=&#34;profile-frame&#34;&gt;&#xA;    &#xA;    &#xA;    &#xA;    &#xA;    &#xA;    &#xA;    &#xA;    &#xA;    &#xA;    &#xA;    &#xA;    &#xA;    &#xA;    &#xA;    &#xA;    &#xA;    &lt;figure class=&#34;align-center profile-shot&#34;&gt;&#xA;        &lt;img&#xA;            src=&#34;https://xxfe.com/images/mypic.png&#34;&#xA;            data-full-src=&#34;https://xxfe.com/images/mypic.png&#34;&#xA;            &#xA;            width=&#34;480&#34; height=&#34;480&#34;&#xA;            alt=&#34;君自强头像&#34;&#xA;            loading=&#34;eager&#34;&#xA;            decoding=&#34;async&#34;&#xA;            style=&#34;width:100%; max-width:420px; height:auto;&#34; /&gt;&#xA;        &lt;figcaption&gt;&lt;/figcaption&gt;&#xA;    &lt;/figure&gt;&#xA;&#xA;&lt;/div&gt;&#xA;&#xA;&lt;/div&gt;&#xA;&#xA;&lt;/section&gt;</description>
    </item>
    <item>
      <title>Home</title>
      <link>https://xxfe.com/home/01-home/</link>
      <pubDate>Sun, 25 Dec 2022 13:04:20 +0800</pubDate>
      <guid>https://xxfe.com/home/01-home/</guid>
      <description>&lt;link rel=&#34;preload&#34; as=&#34;image&#34; href=&#34;https://xxfe.com/images/banner_hu_5bf3c1fb86dbf841.jpg&#34; media=&#34;(min-width: 1200px)&#34;&gt;&#xA;&lt;style&gt;&#xA;.home-section#home {&#xA;    background-image: url(&#39;/images/banner_hu_5bf3c1fb86dbf841.jpg&#39;);&#xA;    background-size: cover;&#xA;    background-position: center;&#xA;}&#xA;@media screen and (max-width: 900px) {&#xA;    .home-section#home {&#xA;        background-image: url(&#39;/images/banner_hu_83f1e09945b19acd.jpg&#39;);&#xA;        background-position: center right 30%;&#xA;    }&#xA;}&#xA;&lt;/style&gt;&#xA;&#xA;&#xA;&lt;section class=&#34;home-section home-hero&#34; id=&#34;home&#34;&gt;&#xA;    &#xA;&#xA;&#xA;&#xA;&#xA;&#xA;&lt;div id=&#34;f0bd389d2713368a&#34; class=&#34;home-block home-copy&#34;&gt;&#xA;    &#xA;    &#xA;&lt;p class=&#34;home-kicker&#34;&gt;AI Infra / Scheduling / Resource Management&lt;/p&gt;&#xA;&lt;h1 class=&#34;hero-title&#34;&gt;君自强&lt;/h1&gt;&#xA;&lt;p class=&#34;hero-lead&#34;&gt;当前重点负责 AI Infra 相关基础设施建设，覆盖大规模 GPU 集群的调度、资源管理与可视化平台能力。&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
